Interested Article - Подсказка по цепочке рассуждений

Подсказка по цепочке рассуждений — метод улучшения способности к рассуждению больших языковых моделей (БЯМ) путём подсказки им сгенерировать серию промежуточных шагов, которые приводят к окончательному ответу на многоэтапную проблему . Впервые он был предложен для языковых моделей исследователями Google в 2022 году .

Было показано, что БЯМ, которые обучаются на больших объёмах текста с использованием методов глубокого обучения , способны генерировать ответы, подобные человеческим . Хотя БЯМ продемонстрировали впечатляющую производительность при решении различных задач на естественном языке , они по-прежнему сталкиваются с трудностями при выполнении некоторых логических задач, требующих логического мышления и выполнения нескольких последовательных шагов для решения арифметических или логических задач . Чтобы решить эту проблему, подсказка по цепочке рассуждений побуждает модель делать промежуточные шаги в рассуждениях, прежде чем дать окончательный ответ на многоэтапную задачу .

Например, на вопрос «Вопрос: В столовой было 23 яблока. Если они использовали 20 яблок для готовки и купили ещё 6, то сколько бы яблок у них осталось?», подсказка по цепочке рассуждений может привести к последовательности рассуждений, которые имитируют , например: «A: Изначально в столовой было 23 яблока. Они использовали 20 блок для готовки. Таким образом, у них было 23 — 20 = 3. Они купили ещё 6 яблок, значит, у них 3 + 6 = 9. Ответ 9» . Это отличается от вывода ответа напрямую.

Было показано, что подсказки по цепочке рассуждений среднем улучшают производительность БЯМ как в арифметических задачах, так и в логических задачах по сравнению со стандартными методами подсказок . Применительно к PaLM , языковой модели с 540B параметров, подсказки по цепочке рассуждений значительно помогли модели, позволив ей работать наравне с языковыми моделями для конкретных задач в нескольких задачах, даже установив новый рекорд в то время превысив результат на логические рассуждения специализированной для этой задачи модели GSM8K .

Подсказки по цепочке рассуждений — это эмерджентное свойство масштаба модели, означающее, что она лучше работает с более масштабными языковыми моделями . Также можно тонко настроить модели на наборах данных подсказок по цепочке рассуждений, чтобы ещё больше расширить эту возможность и стимулировать лучшую результатов .

Метод

Существует два основных метода получения умозаключений по цепочке рассуждений: и . Первоначальное предложение подсказок по цепочке рассуждений продемонстрировало подсказку с несколькими выстрелами, в которой по крайней мере один пример вопроса в паре с надлежащими подсказками по цепочке рассуждений, написанными человеком, предшествует подсказке . Однако с тех пор было обнаружено, что аналогичные рассуждения и прирост производительности также можно получить с помощью подсказок с нулевым выстрелом, которые могут быть такими же простыми, как добавление к подсказке слов «Давайте подумаем шаг за шагом» . Это обеспечивает лучшее масштабирование, поскольку больше не нужно предлагать инженерам конкретные подсказки по цепочке рассуждений для каждой задачи, чтобы получить соответствующий прирост производительности .

Ограничения

Хотя подсказки по цепочке рассуждений могут существенно улучшить производительность задач обработки естественного языка , существуют определённые недостатки. Подсказки по цепочке рассуждений с нулевым выстрелом увеличили вероятность токсичного результата в задачах, где модели могут делать выводы о маргинализированных группах или вредных темах .

Примечания

McAuliffe. (англ.) . CNET . Дата обращения: 10 марта 2023. 26 мая 2023 года.
↑ Wei, Jason (31 October 2022). (англ.) . из оригинала 7 июня 2023 . Дата обращения: 21 марта 2023 . {{ cite journal }} : Cite journal требует |journal= ( справка )
Wei; Zhou (англ.) . ai.googleblog.com . Дата обращения: 10 марта 2023. 11 августа 2023 года.
Tom, Brown (2020). . Advances in Neural Information Processing Systems (англ.) . 33 . из оригинала 24 марта 2023 . Дата обращения: 21 марта 2023 .
Dang. . VentureBeat (8 февраля 2023). Дата обращения: 10 марта 2023. 18 марта 2023 года.
Montti. (англ.) . Search Engine Journal (13 мая 2022). Дата обращения: 10 марта 2023. 26 марта 2023 года.
Ray. (англ.) . ZDNET . Дата обращения: 10 марта 2023. 28 марта 2023 года.
Google. . [твит] . Твиттер (14 мая 2023).
Stokel-Walker. . newscientist.com . Дата обращения: 10 марта 2023.
. syncedreview.com (24 октября 2022). Дата обращения: 10 марта 2023. 10 марта 2023 года.
(амер. англ.) . Google (11 мая 2022). Дата обращения: 10 марта 2023. 23 марта 2023 года.
Wei, Jason (31 August 2022). . Transactions on Machine Learning Research (англ.) . ISSN . из оригинала 22 марта 2023 . Дата обращения: 21 марта 2023 .
Chung, Hyung Won (2022). "Scaling Instruction-Finetuned Language Models". doi : . {{ cite journal }} : Cite journal требует |journal= ( справка )
Wei; Tay, Yi (англ.) . ai.googleblog.com . Дата обращения: 10 марта 2023. 10 марта 2023 года.
Kojima, Takeshi (31 October 2022). (англ.) . из оригинала 29 марта 2023 . Дата обращения: 21 марта 2023 . {{ cite journal }} : Cite journal требует |journal= ( справка )
Dickson. . VentureBeat (30 августа 2022). Дата обращения: 10 марта 2023. 10 марта 2023 года.
Shaikh, Omar (2022). "On Second Thought, Let's Not Think Step by Step! Bias and Toxicity in Zero-Shot Reasoning". doi : . {{ cite journal }} : Cite journal требует |journal= ( справка )

[1] McAuliffe. (англ.) . CNET . Дата обращения: 10 марта 2023. 26 мая 2023 года.

[weipaper-2] Wei, Jason (31 October 2022). (англ.) . из оригинала 7 июня 2023 . Дата обращения: 21 марта 2023 . {{ cite journal }} : Cite journal требует |journal= ( справка )

[3] Wei; Zhou (англ.) . ai.googleblog.com . Дата обращения: 10 марта 2023. 11 августа 2023 года.

[4] Tom, Brown (2020). . Advances in Neural Information Processing Systems (англ.) . 33 . из оригинала 24 марта 2023 . Дата обращения: 21 марта 2023 .

[5] Dang. . VentureBeat (8 февраля 2023). Дата обращения: 10 марта 2023. 18 марта 2023 года.

[6] Montti. (англ.) . Search Engine Journal (13 мая 2022). Дата обращения: 10 марта 2023. 26 марта 2023 года.

[7] Ray. (англ.) . ZDNET . Дата обращения: 10 марта 2023. 28 марта 2023 года.

[8] Google. . [твит] . Твиттер (14 мая 2023).

[9] Stokel-Walker. . newscientist.com . Дата обращения: 10 марта 2023.

[10] . syncedreview.com (24 октября 2022). Дата обращения: 10 марта 2023. 10 марта 2023 года.

[11] (амер. англ.) . Google (11 мая 2022). Дата обращения: 10 марта 2023. 23 марта 2023 года.

[12] Wei, Jason (31 August 2022). . Transactions on Machine Learning Research (англ.) . ISSN . из оригинала 22 марта 2023 . Дата обращения: 21 марта 2023 .

[13] Chung, Hyung Won (2022). "Scaling Instruction-Finetuned Language Models". doi : . {{ cite journal }} : Cite journal требует |journal= ( справка )

[14] Wei; Tay, Yi (англ.) . ai.googleblog.com . Дата обращения: 10 марта 2023. 10 марта 2023 года.

[15] Kojima, Takeshi (31 October 2022). (англ.) . из оригинала 29 марта 2023 . Дата обращения: 21 марта 2023 . {{ cite journal }} : Cite journal требует |journal= ( справка )

[venture1-16] Dickson. . VentureBeat (30 августа 2022). Дата обращения: 10 марта 2023. 10 марта 2023 года.

[17] Shaikh, Omar (2022). "On Second Thought, Let's Not Think Step by Step! Bias and Toxicity in Zero-Shot Reasoning". doi : . {{ cite journal }} : Cite journal требует |journal= ( справка )

Interested Article - Подсказка по цепочке рассуждений

Метод

Ограничения

Примечания

Same as Подсказка по цепочке рассуждений

Подсказка

Подсказка

Гаджеты/Всплывающая подсказка с примечаниями

Подсказка

Гаджеты/Всплывающая подсказка с примечаниями

The title for the last searches