画像認識 - Sun wood AI labs.2

YOLOv10: リアルタイムのEnd-to-Endオブジェクト検出手法

はじめに本論文では、リアルタイムのEnd-to-Endオブジェクト検出手法であるYOLOv10を提案しています。YOLOv10は、高速かつ高精度なオブジェクト検出を可能にし、自動運転やロボット制御など幅広い応用が期待されます。なんJ式論文解...

2024.05.26

AI・機械学習画像認識

2024.05.26

AI・機械学習画像認識

概要最先端の大規模マルチモーダルモデル（LMMs）は、視覚言語タスクで優れた能力を示してきました。しかし、高度な機能にもかかわらず、複数レベルの視覚情報を用いた複雑な推論が必要とされる難しいシナリオでは、LMMsのパフォーマンスはまだ限られ...

2024.03.16

AI・機械学習マルチモーダル画像認識自然言語処理

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...

2024.02.13

AI・機械学習API連携Python画像認識

近年の技術進歩により、画像認識技術は目覚ましい発展を遂げています。その中でも、「You Only Look Once（YOLO）」シリーズは、その高速性と実用性で広く認知されています。しかし、従来のYOLOは予め定義されたカテゴリーに基づい...

2024.02.01

AI・機械学習チュートリアル画像認識