Контекстне вікно на 2 мільйони токенів — достатньо велике, щоб одночасно завантажити вісім повноформатних романів — стало стандартною функцією Google Gemini 3.1 Ultra, коли модель вийшла у квітні 2026 року. Це вдвічі перевищило попередній виробничий рекорд і встановило новий операційний стандарт для корпоративного впровадження ШІ. Жодна конкуруюча модель у загальній доступності не може з нею зрівнятися.
Контекстні вікна — це оперативна пам'ять мовної моделі під час сесії: кожен додатковий токен дозволяє системі утримувати більше інформації одночасно. Gemini 2.0 Ultra, що вийшов наприкінці 2025 року, мав контекст на 1 мільйон токенів. GPT-5 від OpenAI, представлений у березні 2026 року, пропонує 256 000 токенів як стандартний споживчий рівень. Збільшення до 2 мільйонів — це передусім не споживча функція: більшість людей ніколи не напише запит на 2 мільйони токенів. Проте для корпоративних сценаріїв, зокрема юридичного аналізу документів, синтезу медичних записів, аудиту програмного коду та довгострокового фінансового аналізу, розширена ємність має практичне значення і змінює перелік завдань, які можна виконати за одну сесію без обрізання контексту.
Continue reading to see the full article