Рубрика «языковые модели» - 2

От контекста до юрисдикции: 7 ключевых параметров при выборе LLM для вашего проекта

2024-10-15 в 9:18, admin, рубрики: chatgpt, llm, maas, OpenAI, openai api, qwen, внедрение ai, выбор модели, нейросети, языковые модели

Привет! Я Сергей, продакт направления AI в Битрикс24. Последний год мы активно внедряем нейросети в наш продукт, и я хочу поделиться опытом, который может сэкономить вам время и деньги.

Оказалось, что выбор правильной модели нейросети — это целое искусство. Размеры контекста, лицензии, поддержка языков, способы доступа — от этих параметров голова идет кругом. Но разобраться в них критически важно, если вы не хотите потратить кучу времени и денег впустую.

Читать полностью »

Об опыте использования популярных языковых моделей для решения повседневных задач

2024-10-07 в 10:38, admin, рубрики: chatgpt, языковые модели

Новости пугают кликбейтными заголовками, что Chat GPT заменит программистов и они останутся без работы. Ведущий архитектор дивизиона «Горная промышленность» ГК «Цифра» Сергей Степанов рассказывает о том, как он применяет в работе большие языковые модели, что они уже готовы на себя взять, а что пока по силам только программистам и системным архитекторам.

Читать полностью »

Я, Нейросеть: как программисты научили компьютеры говорить

2024-09-30 в 15:14, admin, рубрики: Eliza, gpt, нейросеть, языковая модель, языковые модели

Нейросети сегодня пишут новости, рекламные тексты, стихотворения и даже целые сценарии. Как мы пришли к этому? Рассказываем историю языковых моделей — от симулятора психотерапевта из 1960-х до первых нейросетей в начале 21 века.

Я, Нейросеть: как программисты научили компьютеры говорить - 1

Читать полностью »

Модели Gemini 1.5 от Google: главное о Gemini 1.5 Pro

2024-09-30 в 12:00, admin, рубрики: gemini, Google, llm, искусственный интеллект, языковые модели

Серия Gemini 1.5 представляет собой набор моделей, разработанных для обеспечения высокой производительности в выполнении разнообразных задач, включая текстовые, кодовые и мультимодальные. Эти модели могут использоваться для таких сложных задач, как синтез информации из 1000-страничных PDF-файлов, ответов на вопросы о больших репозиториях кода, содержащих более 10 тысяч строк, а также анализа многочасовых видеороликов и генерации из них полезного контента.

Читать полностью »

Новый взгляд на оценку русскоязычных моделей: обновлённый бенчмарк ruMTEB и лидерборд

2024-09-23 в 12:35, admin, рубрики: Massive Text Embedding Benchmark, rumteb, векторизация, искусственный интеллект, лидерборд, эмбеддинги, языковые модели

Всем привет! Меня зовут Роман Соломатин, я представляю команду AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. Несколько месяцев назад русскоязычное сообщество разработчиков искусственного интеллекта получило инструмент для оценки моделей — бенчмарк ruMTEB (Massive Text Embedding Benchmark). Он предназначен для оценки репрезентации русскоязычных текстов и позволяет объективно сравнивать различные эмбеддинговые модели, которые превращают текст в вектора чисел, ориентированные на работу с русским языком (Читать полностью »

Сэм Альтман: «ИИ следующего поколения будет способен изобретать прорывные технологии и лечить болезни»

2024-09-19 в 16:13, admin, рубрики: llm, OpenAI, большие языковые модели, ИИ, нейросети, Сэм Альтман, языковые модели

По словам генерального директора компании Сэма Альтмана, следующее поколение систем искусственного интеллекта сможет самостоятельно выполнять задачи без участия человека, и это становится возможным благодаря таким моделям, как новая модель o1 от OpenAI.

Читать полностью »

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

2024-09-18 в 5:00, admin, рубрики: chatgpt, gpt, gpt-4, llm, machinelearning, natural language processing, o1, OpenAI, нейросети, языковые модели

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Читать полностью »

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

2024-09-11 в 4:55, admin, рубрики: chatgpt, gpt-4, llm, natural language processing, OpenAI, длиннопост, нейросети, языковые модели

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Читать полностью »

Как устроена языковая модель без перемножения матриц

2024-09-03 в 11:07, admin, рубрики: matmul-free, языковые модели

Нейросети любой архитектуры построены на перемножении матриц. Например, трансформеры из входного вектора создают (тоже перемножением) три матрицы, Q, K и V, которые затем несколько раз перемножаются на пути к получению выходного вектора. Именно умножение матриц с его кубической сложностью (если не прибегать к разного рода ухищрениям) занимает большую часть вычислительных мощностей.

Поэтому возникает естественное желание облегчить эту самую массивную часть вычислений и ускорить таким образом любую архитектуру. Периодически возникают новые подходы и идеи, тут расскажем о последней громкой статье по этой теме — Читать полностью »

Насколько ChatGPT-4o подвержен когнитивным искажениям?

2024-08-28 в 14:45, admin, рубрики: chatgpt, llm, ИИ, ИИ и машинное обучение, когнитивные искажения, языковые модели

Человеческий разум, столь сложный и удивительный, далеко не безупречен. Десятилетия исследований в области когнитивной психологии показали, что наше мышление подвержено систематическим ошибкам, известным как когнитивные искажения. Например, Канеман и Тверски открыли глаза на то, как часто мы подвергаемся влиянию искажений, даже когда абсолютно уверены в рациональности принятого решения. Мы склонны видеть мир не таким, какой он есть, а сквозь призму собственных предубеждений и упрощений. Но что, если эти же искажения проявляются и у искусственного интеллекта?

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «языковые модели» - 2

От контекста до юрисдикции: 7 ключевых параметров при выборе LLM для вашего проекта

Об опыте использования популярных языковых моделей для решения повседневных задач

Я, Нейросеть: как программисты научили компьютеры говорить

Модели Gemini 1.5 от Google: главное о Gemini 1.5 Pro

Новый взгляд на оценку русскоязычных моделей: обновлённый бенчмарк ruMTEB и лидерборд

Сэм Альтман: «ИИ следующего поколения будет способен изобретать прорывные технологии и лечить болезни»

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Как устроена языковая модель без перемножения матриц

Насколько ChatGPT-4o подвержен когнитивным искажениям?

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «языковые модели» - 2

Новости

Актуальные темы

Архив