LogoFree Moondream Generator

Moondream2 技術的な詳細

Moondream2 技術的な詳細

モデルのアーキテクチャ

Moondream2は、SigLIPおよびPhi-1.5からのウェイトを初期化した、18.6億パラメーターモデルです。このコンパクトなアーキテクチャにより、効率的な処理が可能でありながら堅牢な機能が維持されています。

効率的なエッジデバイスの操作

低リソース設定のデバイスで動作するように設計されたMoondream2は、メモリ使用量と処理能力を最適化します。これにより、スマートフォン、IoTデバイス、およびその他のエッジコンピューティングシナリオでの展開に最適です。

ドキュメント理解のパフォーマンス

さまざまなタスク(表、フォーム、複雑な文書理解を含む)で評価されたMoondream2は、小規模モデルに対して有望な結果を示しています。多様なドキュメントタイプから重要情報を印象的な精度で抽出することができます。