maki

AI・機械学習

Whisper Medusaを試してみた:高速で正確な音声認識モデル

音声認識技術の進歩は目覚ましく、最近では精度と速度の両面で大きな改善が見られています。今回は、OpenAIのWhisperモデルをベースに、さらなる高速化を実現した「Whisper Medusa」を実際に試してみました。「Whisper-M...
GPU

Windows版GPUStack完全トラブルシューティングガイド:500エラーとllama-box問題の解決法

GPUStackをWindowsで使用する際に遭遇する可能性のある主要な問題とその解決策を紹介します。基本的な起動方法はこちらダッシュボードの500エラー問題以前のバージョンのGPUStackでは、ダッシュボードUIにアクセスすると500エ...
チュートリアル

Gemma 2 2B 日本語ファインチューニング & TPUv3-8 + Kaggle Hub公開

このノートブックでは、Googleが新たにリリースした軽量ながらも高性能な言語モデル Gemma 2 2B を、日本語データセット databricks-dolly-15k-ja でファインチューニングする方法を紹介します。さらに、Kagg...
ソフトウェア開発

IRISの進化した自動リリースノート生成機能:SourceSageとの統合で更なる効率化を実現

はじめにソフトウェア開発プロジェクトにおいて、リリースノートは変更点を明確に伝え、プロジェクトの進捗を可視化する重要な役割を果たします。しかし、その作成プロセスは時間がかかり、人的ミスのリスクも伴います。IRISの自動リリースノート生成機能...
ソフトウェア開発ツール

LiteLLM x Parallel Function Calling: GeminiとGPT-4o-miniで複数ファイル一括変更(GoogleColab付)

gemini/gemini-1.5-proで複数の差分ファイルの一覧を作成してそれを元にgpt-4o-miniのParallel Function Callingでgitのパッチを実行することでマルチファイルのファイル変更を実現します。 無...
AI・機械学習

LiteLLMで無料Gemini+gpt-4o-mini+Haiku+sonnet3.5のParallel Function Callingを試す

はじめにこんにちは!今回は、LiteLLMライブラリを使って、GoogleのGemini Pro、OpenAIのgpt-4-o-mini、AnthropicのClaude 3.5 sonnet、Claude 3 haikuといった複数のモデ...
チュートリアル

ComfyUIでFlux AIを使う方法:詳細ガイド

はじめにFlux AIは、高品質な画像生成を可能にする強力なAIモデルです。本記事では、ComfyUI上でFlux AIを使用するための詳細な手順を解説します。初心者の方でも理解しやすいよう、ステップごとに丁寧に説明していきます。きたーーー...
機械学習

Gemma2-2b: TPUを活用したファインチューニングとKagglehubへのアップロード

はじめにこんにちは!今回は、Googleが新しくリリースしたGemma2-2b モデルを使って、TPU(Tensor Processing Unit)を活用したファインチューニングを行い、その結果をKagglehubにアップロードする方法を...
ブログ

2024年7月のアウトプットのふりかえり

2024年7月のアウトプットをふりかえるとアウトプットしたものなどをまとめてみました。Blog等2024/07/29OASIS Web UI: インストールから使用まで2024/07/28GPUStack:オープンソースGPUクラスターマネ...
AI・機械学習

Gemma 2 2Bモデルの分散ファインチューニング: TPUを活用した効率的な学習方法(kaggleノート付)

はじめにこんにちは!今回は、Googleが新しくリリースしたGemma 2 2Bモデルを使って、TPU(Tensor Processing Unit)を活用した分散ファインチューニングを行う方法をご紹介します。この記事は、大規模言語モデル(...