Sanaka AIのTinySwallow-1.5BをLM Studioなどのローカル環境で動かす手順

AI活用ブログ
AI活用ブログ

Sanaka AIが開発した「TinySwallow-1.5B」は、最新の知識蒸留手法「TAID(Temporally Adaptive Interpolated Distillation)」を用いて構築された、小規模ながら高性能な日本語言語モデルです。このモデルは約15億のパラメータを持ち、同規模のモデルの中で最高水準の日本語ベンチマークスコアを達成しています。

TinySwallow-1.5Bは、PCやスマートフォンなどのローカル環境での動作を前提に設計されており、オフラインでの利用が可能です。NvidiaのGPUを搭載していないノートPCでも、ローカル環境でTinySwallow-1.5Bを動かくことができます。

TinySwallow-1.5BをLM Studioで動かす手順

LM Studioは、ローカル環境で大規模言語モデル(LLM)を探索、ダウンロード、実行できるツールです。これにより、インターネット接続がない環境でも、LLMを活用した自然言語処理が可能となります。

Sanaka AIのTinySwallow-1.5Bモデルをローカル環境で動作させるための手順をご案内いたします。以下の手順に従ってください。

LM Studioのインストール:

LM Studioは、ローカルで大規模言語モデルを実行するためのツールです。公式サイトから最新バージョンをダウンロードし、インストールしてください。

Hugging FaceでTinySwallow-1.5Bモデルを選択:

Sanaka AIのTinySwallow-1.5Bモデルを入手するためには、以下の手順を行います。

Hugging FaceのSanaka AI公式ページにアクセスします。

「SakanaAI/TinySwallow-1.5B-Instruct-GGUF」というモデルを選択してください。

Hugging Face公式ページのリンク: Sanaka AI TinySwallow-1.5B

LM Studioでダウンロードを実行

LM Studioが起動してから、TinySwallow-1.5Bモデルをダウンロードします。

LM Studioでモデルをロード:

LM Studioを起動し、インターフェースから先ほど配置したTinySwallow-1.5Bモデルをロードします。

モデルのロードが完了したら、動作確認として簡単なプロンプトを入力し、モデルが正常に応答するか確認してください。

NvidiaのGPUがないPCでも、十分に早いスピードで文章を生成します。

動作確認と最適化:

モデルが正常に動作することを確認したら、必要に応じてLM Studioの設定を調整し、パフォーマンスの最適化を行ってください。

LM Studioで業務データを活用するには?

LM StudioのRAG機能

LM Studioでは、RAG(Retrieval Augmented Generation)を活用して、ユーザーがアップロードしたドキュメントから情報を取得し、それをもとにLLM(大規模言語モデル)が回答を生成できます。これは、事前に学習されたデータだけでなく、ユーザーが提供する特定の文書に基づいて、より的確な回答を得るための技術です。

主な機能

  1. ファイルのアップロード
    • ユーザーは最大 5つのファイル を同時にアップロード可能。
    • 合計 30MB までのファイルを扱える。
    • 対応フォーマット: PDF, DOCX, TXT, CSV
  2. 詳細な質問を推奨
    • ユーザーの質問が具体的であればあるほど、関連する情報を正確に取得しやすくなる。
    • 例:「2023年の売上データについて教えてください」よりも、「2023年のQ3の売上データをCSVから取得し、前年比と比較してください」のほうが精度が向上。
  3. 検索と回答の生成
    • アップロードしたファイル内の情報を検索し、該当する部分を抽出。
    • LLMがその情報をもとに回答を生成。
    • ユーザーは異なる質問を試すことで、より適切な回答を得られる。

活用例

  • レポート分析: PDFのレポートをアップロードし、要点を自動で要約。
  • 契約書チェック: DOCXの契約書から特定の条項を検索し、解説を得る。
  • データ分析: CSVファイルの売上データから傾向を抽出し、グラフの作成をサポート。

LM StudioのRAG機能を使えば、ユーザー自身のデータを活用しながら、より的確な情報を得ることが可能になります。

参考)新手法「TAID」を用いた小規模日本語言語モデル

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする

監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。

「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

Chat Icon
タイトルとURLをコピーしました