Что такое токены в нейросетях?

Токен — единица текста (~4 символа на русском). 1000 токенов ≈ 250 слов. Тариф MashaGPT Base даёт 20M токенов — это ~1000 длинных диалогов в месяц.

Токен — это минимальная единица текста, которую обрабатывает нейросеть. На русском языке 1 токен ≈ 3-4 символа (примерно 0.7 слова). На английском — 1 токен ≈ 4 символа (примерно 1 слово). Пунктуация и пробелы тоже считаются.

Примеры: слово «нейросеть» = 3 токена. Предложение «Привет, как дела?» = 6 токенов. Страница текста (500 слов) ≈ 700 токенов. Длинная статья (2000 слов) ≈ 3000 токенов. Один диалог (вопрос + ответ) ≈ 500-2000 токенов.

Тарифы MashaGPT: Base (20M токенов) ≈ 1000 длинных диалогов или 300 статей. Ultra (50M) ≈ 2500 диалогов. Pro (700M) ≈ 35000 диалогов. Для большинства пользователей Base достаточно с запасом.

Попробуйте MashaGPT бесплатно

50+ нейросетей в одном месте — без VPN, на русском языке

Начать бесплатно →