ChatGPT トークナイザー

LLM トークナイザー

OpenAIモデルでテキストが使う正確なトークン数を、色分けされたトークン表示とともに確認できます。tiktoken を使いすべてブラウザ内で処理され、テキストはアップロードされません。

ChatGPT トークナイザーは、テキストが OpenAI モデルで使う「トークン数」を正確に数えます。テキストを貼り付けると、 API で課金されるのと同じ正確なトークン数を返し、さらに色分けされたトークン単位の表示で、モデルが単語をどこで区切るのかを確認できます。 OpenAI 公式のバイトペア符号化である tiktoken を使ってすべてブラウザ内で動作するため、正確・即時・無料・安全です。

トークンとは?

トークンは、 OpenAI モデルが読み取り、課金の単位となる最小のまとまりです。多くは単語の一部で、短い単語1つまるごとのこともあれば、数文字だけ、あるいは「スペース+単語の先頭」のこともあります。英語のおおまかな目安は 1トークン ≈ 4文字 ≈ 0.75単語 ですが、正確に知る唯一の方法は本物のエンコーダーを実行することです。本ツールがまさにそれを行います。

自分のモデルはどのエンコーディング?

OpenAI モデルは少数のエンコーディングを共有しています。使うモデルに合わせて選んでください。

エンコーディング対象モデル主な用途
o200k_baseGPT-4o 、 GPT-4o mini 、 GPT-4.1、 o1 / o3 / o4(以降の新モデル)現行のチャット・推論モデル。最新で最も効率的なトークナイザー
cl100k_baseGPT-4、 GPT-4 Turbo 、 GPT-3.5 Turbo 、 text-embedding-3、 text-embedding-ada-002前世代のチャットモデルと現行の埋め込みモデル

迷ったら o200k_base を選んでください。今日多くの人が使うモデル( GPT-4o ・ GPT-4.1)で使われています。

トークン数の数え方

  1. テキストをボックスに貼り付け・入力します。
  2. モデル系統を選びます( GPT-4o / GPT-4.1 / o 系なら o200k_base、 GPT-4 / GPT-3.5 Turbo なら cl100k_base)。
  3. 上部の トークン数 を、文字数・単語数・文字/トークンとあわせて確認します。
  4. 下の色分けチップで、テキストがどのようにトークンへ分割されるかを確認します。トークン ID を表示 を切り替えると、各トークンの整数 ID が見られます。
  5. トークン数をコピー で数値だけを、​トークン ID をコピー で ID のリスト全体をコピーできます。

例:入力 → 出力

入力:

Tokenization is fun!

o200k_base では 5トークン になります: Tokenization is fun!。"Tokenization" が2つのトークンに分かれ、先頭のスペースが is fun のトークンに含まれている点に注目してください。これが、トークン数と単語数が一致しない理由です。

なぜトークンを数えるのか?

  • コスト: OpenAI はトークン単位で課金するため、トークン数が本当のコスト要因です。文字数を数えるよりずっと正確です。
  • コンテキスト上限: どのモデルにもトークン単位の最大コンテキスト長があります。先に数えておけば、プロンプトと想定される応答が収まるか分かります。
  • プロンプト設計: プロンプトを1,200から800トークンへ削るのは、編集しながらライブで確認できる測定可能な改善です。

正確でプライベート?

どちらもはいです。本ツールは OpenAI 公式の tiktoken エンコーディング(o200k_basecl100k_base)を、オープンソースの gpt-tokenizer ライブラリ経由で使います。「4で割る」ような概算ではないため、 API と一致します。トークナイザーのコードは公開 CDN から一度だけ読み込まれ、あとはお使いの端末上で動作します。貼り付けたテキストがアップロードされることはないため、機密のプロンプトや秘密のデータにも安全に使えます。

色分け表示についての補足: 一部のトークンはマルチバイト文字(絵文字や日本語など非ラテン文字でよく起こります)の一部のバイト列です。単独で表示すると � の置換文字になりますが、前後のトークンと合わされば正しいテキストに戻り、トークン数は正確なままです。

運営者情報

Unbounded Pioneering株式会社
ターニントAI

ターニントAIツールは、AIエージェントプラットフォーム「Turnint AI」を提供する Unbounded Pioneering株式会社が開発・運営する無料ツール群です。

鈴木 凌介
鈴木 凌介創業者・代表取締役

AIエージェントプラットフォーム「Turnint AI」を提供する Unbounded Pioneering株式会社の創業者・代表取締役。機械学習・AIプロダクト開発のエキスパート。大学在学中は研究室にて機械学習の研究に従事。その後、株式会社プレイド・楽天・リクルートにおいて、ソフトウェアエンジニアとして大規模プロダクトの設計・開発を手がけるとともに、新規事業開発を推進。現在は生成AI・AIエージェント領域を専門とし、エンジニアリングと事業開発の両面から一貫してプロダクト開発に携わる。ウェブ技術領域における複数の特許を発明。

特許発明者(特許第6887648号・特許第7480958号)・Turnint AI関連技術で特許出願中

お問い合わせはこちら

お世話になっております

当社へご興味をもっていただき、ありがとうございます。1営業日以内に、担当者よりご連絡を差し上げます。

こんなご相談にお答えしています

  • ターニントAIの導入・活用の相談
  • ターニントAIのデモ・トライアル
  • AI活用全般のご相談(自社プロダクト以外も歓迎)
  • アライアンス・パートナーシップ
  • その他のご質問

オンラインで相談する

カレンダーから直接ミーティングを予約することも可能です。

テンプレートを選ぶか、自由にご記入ください。