Когнитивные способности LLM можно оценивать по способности мыслить логически и строить цепочки рассуждений, а можно по способности разгадывать загадки, требующие смекалки и нестандартного мышления. Почему-то всё внимание направлено только на первое и совсем не исследовано второе.
Люди в разной степени владеют этими навыками, а как это у моделей?