career advancement

LLM

CodeGemmaの使い方

こんにちは!今回は、Googleが開発したコード生成AI「CodeGemma」の使い方について、初心者の方でも完璧に理解できるよう、丁寧に解説していきます。コード補完やコード生成に特化したCodeGemmaを活用して、開発者の生産性を向上さ...
LLM

CodeGemmaの完全解説:Google製コード生成AI

こんにちは!今回は、Googleが開発した最先端のコード生成AI「CodeGemma」について、初心者の方でも完璧に理解できるよう、詳細に解説していきます。CodeGemmaは、コード補完やコード生成に特化した大規模言語モデル(LLM)であ...
LLM

🤗 Weights & Biases とUnslothを使用したMistral-7Bモデルのファインチューニング

はじめにこの記事では、unslothライブラリを使用して、Mistral-7Bモデルをファインチューニングする方法について解説します。unslothは、メモリ使用量を大幅に削減しながら、高速にファインチューニングを行うことができるライブラリ...
LLM

PytorchとWandbを使ったモデル学習の基本

機械学習のモデル開発において、実験管理は非常に重要です。この記事では、Pytorchを用いたモデル学習の基本的な流れと、実験管理ツールであるWandbの使い方について解説します。必要なライブラリのインストールまず、必要なライブラリをインスト...
Docker

ParrotOSへのDocker導入ガイド

はじめにこのガイドでは、ParrotOSにDockerをインストールする方法を解説します。ParrotOSのコードネームとDebianのコードネームの違いによる問題を解決し、簡単にDockerを導入できるようになります。こちらの記事もおすす...
AI

musicgen-songstarter-v0.2 入門ガイド

はじめにmusicgen-songstarter-v0.2 は、テキストから音楽を生成することができる機械学習モデルです。このモデルを使うことで、音楽制作のアイデア出しや、既存の音楽サンプルをリミックスすることができます。musicgen-...
AGI

OSWorld: オープンエンドなタスクのためのマルチモーダルエージェントのベンチマーク

はじめにOSWorldは、実際のコンピュータ環境でオープンエンドなタスクを実行するマルチモーダルエージェントのベンチマークです。このリポジトリでは、環境、ベンチマーク、プロジェクトページが提供されています。主な特徴は以下の通りです:実際のデ...
LLM

Style-Bert-VITS2でずんだもんの声を学習させてみた(GoogleColabのノート付き)

近年、AI技術の進化は目覚ましく、その一環として音声合成技術も大きく前進しています。特に、話者の声質や話し方を模倣する技術は、エンターテイメントから教育まで幅広い分野での応用が期待されています。この記事では、Style-Bert-VITS2...
AI実況

Style-Bert-VITS2で生成した音声をVTube StudioとPython連携して表情を制御してみた

最新技術を駆使して、リアルタイムでキャラクターの表情をコントロールすることは、多くのバーチャルYouTuberやストリーマーにとって非常に興味深いトピックです。この記事では、Style-Bert-VITS2で生成した音声を使い、VTube ...
AI実況

VTube StudioとPython連携してモーション発動させてみた

バーチャルYouTuber(VTuber)の世界では、配信や動画の中でキャラクターを動かすために様々な技術が用いられています。その中でも、VTube Studioはリアルタイムでのアバター制御に特化したアプリケーションとして広く利用されてい...