大規模言語モデル OneDiffusion:多彩な拡散モデルによる画像生成・理解タスクへの対応(GoogleColab付) はじめに本ノートブックでは、OneDiffusionと呼ばれる汎用的な大規模拡散モデルについて紹介します。このモデルは、多種多様な画像生成・画像理解タスクに双方向的(テキスト→画像、画像→記述、画像編集など)に対応することを目指して設計され... 2024.12.12 大規模言語モデルAI画像生成
クラウドサービス Claude Desktop MCP × Sourcesage × Replit Agent × AWS統合ガイド はじめに本記事では、企業環境でのセキュアな開発を実現するための統合アプローチについて解説します。Claude Desktop MCP、Sourcesage、Replit Agent、そしてAWSのサービスを組み合わせることで、セキュリティを... 2024.11.28 クラウドサービスソフトウェア開発サイバーセキュリティAI開発
AIツール Claude APIを活用した究極のPCリモート制御ツール – Computer Use – OOTB リポジトリ概要このリポジトリは、Anthropic社のClaude API を利用して、コンピュータをリモートで制御できるOut-of-the-Box (OOTB) ソリューションを提供しています。Docker を必要とせず、Windows... 2024.11.19 AIツールAIアプリケーション開発リモートアクセス
Web開発 PythonでSupabaseのテーブルを作成し、Gradio 5のアプリを構築する方法 近年、SupabaseはオープンソースのFirebase代替として注目を集めており、Pythonコミュニティでもその利用が急増しています。本記事では、Pythonを使用してSupabaseのデータベースにテーブルを作成し、そのテーブルと連携... 2024.11.16 Web開発データベースPython開発
Python開発 数行でできる!GroqとGradioを使ったLLMアプリケーション開発入門(📒 GoogleColab ノートブック) このノートブックでは、GroqのAPIを使用してGradioベースのチャットインターフェースを構築する方法を学びます。環境設定まず最初に、必要なライブラリをインストールします。!pip install groq-gradioAPIキーの設定... 2024.11.05 Python開発AIチャットボット開発
AI x.inferをGoogle Colabで試してみた!(Googleノートブック付) はじめに最近、新しい画像認識モデルが次々とリリースされていますよね。例えばGPT-4V やClaude 3 など、画像認識の性能は日々進化しています。でも、こんな悩みはありませんか?🤔 新しいモデルを試したいけど、セットアップが面倒😅 異な... 2024.10.26 AI画像処理機械学習Python開発
音声合成 open-notebooklmのソースコード解説 open-notebooklm は、PDFファイルやウェブページのテキスト内容をもとに、ポッドキャスト形式の音声ファイルを生成するオープンソースプロジェクトです。オープンソースのAIモデル(Llama 3.1 405B、MeloTTS、Ba... 2024.10.06 音声合成オープンソースPython開発