chatgpt

AI

Anthropicとは

AI 安全性研究のフロンティアAnthropic は、AI 技術の発展と社会実装において重要な役割を担う、サンフランシスコに本拠を置く AI 安全性と研究開発の会社です。同社は、AI がもたらす可能性を最大限に引き出しつつ、その安全性と信頼...
LLM

Gorilla OpenFunctions: 大規模言語モデルとAPIを繋ぐ画期的なオープンソース・プロジェクト

Gorilla OpenFunctionsとはGorilla OpenFunctionsは、大規模言語モデル(Large Language Model, LLM)のチャット補完機能を拡張し、自然言語の指示とAPIの文脈から実行可能なAPI呼...
Gemini

LangchainとGeminiを使ってみた(GoogleColab付)

Langchainは、言語モデルを活用したアプリケーション開発のためのフレームワークです。この記事では、Langchainを使ってGoogleのGenerative AIモデルを効果的に使用する方法を、初心者にも分かりやすく解説します。La...
AI実況

Deepgramでマイクからリアルタイム文字起こしをしてみた

Deepgramは、最先端の音声認識技術を提供するプラットフォームです。この記事では、Deepgramを使ってマイクからの音声をリアルタイムで文字に変換する方法を、初心者にも分かるように解説します。Pythonを使ったシンプルなスクリプトを...
LLM

Local RAGをWindowsのOllama for Windows (Preview)で動かしてみた

最近、Windowsで動作するOllama for Windows (Preview)を使って、Local RAG(Retrieval Augmented Generation)を体験してみました。この記事では、そのプロセスと私の体験をステ...
AI

TTS Arena: 実際の環境でテキストから音声へのモデルを評価する

TTS Arena: Benchmarking Text-to-Speech Models in the Wildこちらの記事の日本語版です。導入 (Introduction)テキストから音声への変換モデル(TTSモデル)の品質を自動的に測...
AI実況

Faster WhisperをDockerでワンパン起動させてみた (CUDA12)

Faster Whisperを使用して、手早くかつ効率的に音声認識を行う方法について、Dockerを使った手順を初心者にもわかりやすく解説します。Dockerを用いることで、環境依存を減らし、どのようなマシンでも同じ条件でFaster Wh...
AI実況

Faster WhisperのCTranslate2による高速な音声書き起こし【日本語版リポジトリ】

faster-whisper は、OpenAIのWhisperモデルをCTranslate2 を使って再実装したものです。CTranslate2は、Transformerモデルのための高速な推論エンジンです。この実装は、同じ精度でopena...
AI

VS Code Continue と Geminiを使った 無料AIエディタ~使ってみた編①~

導入(Introduction)Continue(コンティニュー)とは? Continueは、VS Code(VSコード)とJetBrains(ジェットブレインズ)向けのオープンソースの自動操縦機能(autopilot)です。これは、任意の...
AI

VS Code Continue と Gemini(gemini-openai-proxy) を使った無料AIエディタ

開発者の間で、コーディング作業にChatGPTなどのAIを活用する動きが加速しています。しかし、これまではAIからの回答をコードベースに組み込むために、多くのコピーアンドペーストや編集作業が必要とされ、手間がかかっていました。そこで、VS ...