Python

チュートリアル

ClearVoice: AI音声処理ツールキットを試してみた

はじめに音声処理技術の発展により、ノイズ除去や音声分離などの高度な処理がより身近になってきました。今回は、オープンソースのAI音声処理ツールキット「ClearVoice」をGoogle Colabで実際に試してみたので、その手順と感想をまと...
AWS

📄 PDF内の画像も読み取れるAI文書処理アプリの使い方

AWS BedrockとClaude Sonnet 4を使った「bedrock_pdf_app」の使い方をご紹介します。従来のPDF処理ツールとの大きな違いは、テキストだけでなく画像・図表も理解できる点です。🔧 セットアップ方法Bedroc...
チュートリアル

Google ColabでGPT Image:猫耳・犬耳キャラクター生成クックブック

このGoogle Colabクックブックでは、GPT Imageを使用して猫耳女性や犬耳男性などのアニメ風キャラクターを生成・編集する方法を学びます。ブラウザ上で直接実行でき、高品質なキャラクターアートを作成できます。GPT Image I...
チュートリアル

Google ColabでGemma + DeepEval QA評価システム構築ガイド

Google Colabの無料環境でGemma3nモデルを使い、DeepEvalによる高度なLLM as a Judge評価を実現する完全ガイドです。複雑な設定は不要で、環境変数変更だけでプロフェッショナルなQA評価システムが構築できます。...
AI評価

llama.cpp × Gemma3nでlogprobs出力!詳細な確率分析(GoogleColab📒ノートブック付)

このノートブックでは、llama.cppでGemma3nを動かし、トークンの生成確率(logprobs)を詳細に分析する方法を解説します。このノートブックでできることGemma3nの修正済みGGUFを使用(Google公式版は動作しません!...
LLM

HuggingFaceからGemma3nをダウンロードしてllama.cppで動かす(Google Colab📒ノートブック付)

HuggingFaceからGemma3nの修正済みGGUFファイルをダウンロードして、llama.cppで実行する効率的な方法です。GraphGen JP ✖ gemma3n でファインチューニングしてみる7⃣無事に、Unsloth版のGe...
LLM

OpenHands CLIでカスタムOpenAI互換モデル(Litellm)を設定する方法

OpenHandsでは、OpenAI、Anthropic、その他のLLMプロバイダーだけでなく、カスタムのOpenAI互換APIエンドポイントも使用できます。この記事では、CLIの/settingsコマンドを使用してLitellmのカスタム...
AIエージェント

OpenHands CLI 完全ガイド

概要OpenHands CLIは、AIパワードな開発エージェントをターミナルから直接利用できる強力なコマンドラインインターフェースです。WebUIを使わずに、コマンドラインでAIアシスタントと対話し、コード作成、バグ修正、リファクタリングな...
API

Amazon Nova Act を体験してみた!自動ブラウザ操作の新時代

Amazonが研究プレビューとして公開している「Nova Act」を実際に試してみました。この記事では、Nova Actの特徴と実際の動作について紹介します。Nova Actとは?Nova Actは、ウェブブラウザ上で信頼性の高いアクション...
3Dモデリング

Roo-Codeで実現する自然言語からのCADモデリング:簡単な机の設計事例

はじめに近年、自然言語を用いたコード生成が注目を集めていますが、その応用範囲は一般的なプログラミングだけでなく、CAD(Computer-Aided Design)にまで広がっています。本記事では、VS Codeの生成AI拡張機能「Roo-...