チュートリアル ClearVoice: AI音声処理ツールキットを試してみた はじめに音声処理技術の発展により、ノイズ除去や音声分離などの高度な処理がより身近になってきました。今回は、オープンソースのAI音声処理ツールキット「ClearVoice」をGoogle Colabで実際に試してみたので、その手順と感想をまと... 2025.07.26 チュートリアル音声処理開発環境AI
AWS 📄 PDF内の画像も読み取れるAI文書処理アプリの使い方 AWS BedrockとClaude Sonnet 4を使った「bedrock_pdf_app」の使い方をご紹介します。従来のPDF処理ツールとの大きな違いは、テキストだけでなく画像・図表も理解できる点です。🔧 セットアップ方法Bedroc... 2025.07.23 AWSAIチュートリアルAIツール
チュートリアル Google ColabでGPT Image:猫耳・犬耳キャラクター生成クックブック このGoogle Colabクックブックでは、GPT Imageを使用して猫耳女性や犬耳男性などのアニメ風キャラクターを生成・編集する方法を学びます。ブラウザ上で直接実行でき、高品質なキャラクターアートを作成できます。GPT Image I... 2025.07.17 チュートリアルAI画像生成Google Colab
チュートリアル Google ColabでGemma + DeepEval QA評価システム構築ガイド Google Colabの無料環境でGemma3nモデルを使い、DeepEvalによる高度なLLM as a Judge評価を実現する完全ガイドです。複雑な設定は不要で、環境変数変更だけでプロフェッショナルなQA評価システムが構築できます。... 2025.07.16 チュートリアルAI評価LLM
AI評価 llama.cpp × Gemma3nでlogprobs出力!詳細な確率分析(GoogleColab📒ノートブック付) このノートブックでは、llama.cppでGemma3nを動かし、トークンの生成確率(logprobs)を詳細に分析する方法を解説します。このノートブックでできることGemma3nの修正済みGGUFを使用(Google公式版は動作しません!... 2025.07.12 AI評価開発環境AI・機械学習LLM
LLM HuggingFaceからGemma3nをダウンロードしてllama.cppで動かす(Google Colab📒ノートブック付) HuggingFaceからGemma3nの修正済みGGUFファイルをダウンロードして、llama.cppで実行する効率的な方法です。GraphGen JP ✖ gemma3n でファインチューニングしてみる7⃣無事に、Unsloth版のGe... 2025.07.12 LLMモデル利用チュートリアル開発環境
LLM OpenHands CLIでカスタムOpenAI互換モデル(Litellm)を設定する方法 OpenHandsでは、OpenAI、Anthropic、その他のLLMプロバイダーだけでなく、カスタムのOpenAI互換APIエンドポイントも使用できます。この記事では、CLIの/settingsコマンドを使用してLitellmのカスタム... 2025.06.20 LLMAI開発ツールCLI
AIエージェント OpenHands CLI 完全ガイド 概要OpenHands CLIは、AIパワードな開発エージェントをターミナルから直接利用できる強力なコマンドラインインターフェースです。WebUIを使わずに、コマンドラインでAIアシスタントと対話し、コード作成、バグ修正、リファクタリングな... 2025.06.20 AIエージェントAI開発ツールCLI
API Amazon Nova Act を体験してみた!自動ブラウザ操作の新時代 Amazonが研究プレビューとして公開している「Nova Act」を実際に試してみました。この記事では、Nova Actの特徴と実際の動作について紹介します。Nova Actとは?Nova Actは、ウェブブラウザ上で信頼性の高いアクション... 2025.04.13 API開発ツールAIとソフトウェア開発
3Dモデリング Roo-Codeで実現する自然言語からのCADモデリング:簡単な机の設計事例 はじめに近年、自然言語を用いたコード生成が注目を集めていますが、その応用範囲は一般的なプログラミングだけでなく、CAD(Computer-Aided Design)にまで広がっています。本記事では、VS Codeの生成AI拡張機能「Roo-... 2025.03.17 3DモデリングAIとソフトウェア開発