AI

チュートリアル

Google ColabでGPT Image Input fidelityを使った画像の生成と編集

このGoogle Colabクックブックでは、画像生成機能を持つ新しい大規模言語モデルであるGPT Imageの使い方を学びます。このノートブックはGoogle Colab環境で動作し、ブラウザ上で直接実行できます。このモデルは世界に関する...
ソフトウェア開発

UNOを使った最先端の画像生成:単一から複数の被写体へのカスタマイズ(ノートブック付)

今回は、ByteDanceの研究チームが開発した「UNO」と呼ばれる画期的な画像生成フレームワークについて紹介します。このColabノートを使って、UNOの機能を実際に試してみましょう。セットアップ手順まずはGitHubからリポジトリをクロ...
エンターテイメント

3.5次元アイドル:AIエージェントが拓く新たなアイドル像

こちらの記事は筆者のアイデアをもとに、OpenAI Gpt4.5のdeep researchで記事を執筆しています3.5次元アイドルの概念とは「3.5次元アイドル」とは、現実世界(3次元)のアイドルをベースとしながら、AI技術(生成AI・L...
3Dモデリング

Roblox/cube3d-v0.1を試す: テキストから3Dモデルを生成しよう(📒ノートブック付)

このノートブックでは、Robloxが開発した3Dモデル生成AIである「Cube3D」を使って、テキストプロンプトから3Dモデルを生成する方法を学びます。Cube3Dは、テキスト記述から詳細な3Dオブジェクトを生成できる強力なAIモデルです。...
AI

エージェント依存化ライン ― AIツール依存がもたらすエンジニアリングの二極化現象

はじめに近年、AI技術の進歩により、ソフトウェア開発の現場でも自動補完やコード生成など、さまざまなタスクでAIツールが利用されるようになりました。しかし、その一方で、ジュニアエンジニアや基礎力が十分に身についていない技術者が、AIエージェン...
AI API

Claude Citations APIとは?

Claude Citations APIとは?はじめに2025年1月24日、Anthropic社は自社のAPIおよびGoogle CloudのVertex AI向けに、新機能「Citations」を正式にリリースしました。Citations...
Web開発

DeepSeek R1 × Roo-cline: Hugging Face Spacesギャラリーの実装 🚀

はじめに今回は、DeepSeek R1とRoo-clineを組み合わせて、Hugging Face Spacesのギャラリーページを作成してみました。DeepSeek R1の優れた推論能力とRoo-clineの自動化機能を活用することで、効...
CAD

「CAD as a Language」:コードと生成AIが拓く新たな設計アプローチ

はじめに本記事は「CAD as a Language」という新しいコンセプトを、はじめて定義・提示するものです。従来のCAD(Computer Aided Design)は、主にGUIを用いた直感的な操作でモデルを構築する手法が一般的でした...
LLM

OllamaのK/V Context量子化で実現するVRAM削減とモデル性能向上

はじめに:K/V Context量子化とはOllamaに革新的な機能、K/V context cache量子化が実装されました。この技術により、LLM(大規模言語モデル)のVRAM使用量を大幅に削減しながら、より大きなコンテキストサイズやモ...
ソフトウェア開発

HarmonAI IIIの事例から学ぶ!生成AIを活用したリポジトリデザイン

はじめにリポジトリデザインは、単なる見た目の装飾ではありません。それは開発効率、プロジェクトの持続可能性、そしてコミュニティとの関係性を根本から変える戦略的な取り組みです。本稿では、HarmonAI IIIの事例を通じて、最新のリポジトリデ...