Online

AI

Google ColabでKaggleデータセットをダウンロードする方法

Google Colabは無料で利用できるクラウドベースのJupyter Notebook環境です。Colabを使うと、ブラウザ上でPythonコードを実行し、機械学習モデルの構築やデータ分析を手軽に行えます。ここでは、Google Col...
LLM

C4AI Command-R Google Colab L4で動かしてみた

はじめに本記事では、Cohere For AIが開発した35億パラメータの大規模言語モデルであるC4AI Command-Rを使用して、Google Colab L4で実装する方法について解説します。Command-Rは、推論、要約、質問応...
LLM

日本語版:C4AI Command R+モデルカード

🚨 このモデルは、C4AI Command R+の非量子化バージョンです。bitsandbytesを使用したC4AI Command R+の量子化バージョンはこちらで見つけることができます。モデルの概要C4AI Command R+は、1,...
AI実況

OwlWhisper: 初心者向けのキャラクターエージェント

はじめにOwlWhisperは、高速な音声認識ライブラリ「Faster Whisper」と、高品質な音声合成ライブラリ「Style-Bert-VITS2」を組み合わせたプロジェクトです。初心者でも簡単に音声認識と音声合成を体験できるように設...
LLM

大規模マルチモーダルモデル(Large Multi-Modal Models、以下LMMs)における視覚言語調整を促進するための足場座標(Scaffolding Coordinates)

概要最先端の大規模マルチモーダルモデル(LMMs)は、視覚言語タスクで優れた能力を示してきました。しかし、高度な機能にもかかわらず、複数レベルの視覚情報を用いた複雑な推論が必要とされる難しいシナリオでは、LMMsのパフォーマンスはまだ限られ...
LLM

Style-Bert-VITS2でずんだもんの声を学習させてみた(GoogleColabのノート付き)

近年、AI技術の進化は目覚ましく、その一環として音声合成技術も大きく前進しています。特に、話者の声質や話し方を模倣する技術は、エンターテイメントから教育まで幅広い分野での応用が期待されています。この記事では、Style-Bert-VITS2...
AI実況

Style-Bert-VITS2で生成した音声をVTube StudioとPython連携して表情を制御してみた

最新技術を駆使して、リアルタイムでキャラクターの表情をコントロールすることは、多くのバーチャルYouTuberやストリーマーにとって非常に興味深いトピックです。この記事では、Style-Bert-VITS2で生成した音声を使い、VTube ...
AI実況

VTube StudioとPython連携してモーション発動させてみた

バーチャルYouTuber(VTuber)の世界では、配信や動画の中でキャラクターを動かすために様々な技術が用いられています。その中でも、VTube Studioはリアルタイムでのアバター制御に特化したアプリケーションとして広く利用されてい...
AI

VS Code Continue と Gemini(gemini-openai-proxy) を使った無料AIエディタ

開発者の間で、コーディング作業にChatGPTなどのAIを活用する動きが加速しています。しかし、これまではAIからの回答をコードベースに組み込むために、多くのコピーアンドペーストや編集作業が必要とされ、手間がかかっていました。そこで、VS ...
魔法使いへの道

サイバーセキュリティ入門 (Introduction to Cybersecurity)【TryHackMe】

サイバーセキュリティ入門 (Introduction to Cybersecurity)サイバーセキュリティは、常に善良なハッカー(ホワイトハット)と悪意のあるハッカー(ブラックハット)の間の競争です。サイバー世界の脅威が進化するにつれて、...