◈ Token Compression Engine

Your prompts are verbose. Your models don't need them to be.
TokenShrink compresses prompts — same results, fewer tokens. Works with Claude, GPT, Gemini, Ollama — any LLM. Open source ↗

Typical savings: 15-35% on system prompts ·
Works with 8 AI providers ·
51 tests passing

⌘+Enter to shrink

npm install tokenshrink Read Docs →

Works with every LLM provider

◎OpenAI

◆Anthropic

△Google AI

✦Mistral

⊙Ollama

□Any LLM

◉

5.4M

tokens saved

◈

100%

Open source

◎

< 200ms

Processing time

✦

All LLMs

Compatible

How It Works

Paste your prompt

System messages, user prompts, documents — anything you send to an LLM.

We compress it

Our engine replaces verbose phrases with short codes and prepends a tiny decoder header.

Use fewer tokens

Use the compressed version in your API calls. Same AI quality, fewer tokens.

Drop-in SDK

Two lines of code. Automatic compression on every API call.

app.js

import { compress } from 'tokenshrink';
import OpenAI from 'openai';

// Compress your system prompt
const { compressed, stats } = compress(longPrompt);
console.log(`Saved ${stats.tokensSaved} tokens`);

// Use with any LLM — OpenAI, Anthropic, local models
const openai = new OpenAI();
const res = await openai.chat.completions.create({
  model: 'gpt-4o',
  messages: [{ role: 'system', content: compressed }],
});

npm install tokenshrink

Compress your
prompts for free

No account required. Open source. Compress and ship.

$ npm install tokenshrink — save tokens instantly

Get started

import { compress } from 'tokenshrink'; import OpenAI from 'openai'; // Compress your system prompt const { compressed, stats } = compress(longPrompt); console.log(`Saved ${stats.tokensSaved} tokens`); // Use with any LLM — OpenAI, Anthropic, local models const openai = new OpenAI(); const res = await openai.chat.completions.create({ model: 'gpt-4o', messages: [{ role: 'system', content: compressed }], });

Same AI, fewer tokens.Ship smarter.

How It Works

Paste your prompt

We compress it

Use fewer tokens

Drop-in SDK

Compress yourprompts for free

Same AI, fewer tokens.Ship smarter.

How It Works

Paste your prompt

We compress it

Use fewer tokens

Drop-in SDK

Compress yourprompts for free

Compress your
prompts for free

Compress your
prompts for free