AI „knuje” i próbuje „uciekać”? Testy nad ChatGPT wywołują ciarki na plecach
5 grudnia firma OpenAI w nietuzinkowy sposób rozpoczęła prezentację swoich nowych produktów. Zapowiedziała, że codziennie przez 12 dni roboczych o godz. 19 (polskiego czasu) będzie przeprowadzać transmisje na żywo, pokazując, co udostępni użytkownikom. Już pierwszy dzień okazał się hitem, gdyż firma zaskoczyła pełną wersją swojego najbardziej zaawansowanego modelu ChatGPT o nazwie o1, dotychczas dostępną tylko w wersji „poglądowej” (o1 preview).
Wyróżnia się ona zdolnością do „myślenia” przed udzieleniem odpowiedzi, czyli przetwarza wewnętrznie serię pośrednich kroków, co pomaga jej dojść do dokładnej końcowej odpowiedzi. Wcześniejsze modele koncentrowały się „jedynie” na szybkim generowaniu płynnych językowo odpowiedzi. Dzięki temu o1 ma być znacznie lepszy w radzeniu sobie ze skomplikowanymi zadaniami, takimi jak pisanie kodu komputerowego czy rozwiązywanie problemów matematycznych. Według OpenAI w kwalifikacyjnym egzaminie do Międzynarodowej Olimpiady Matematycznej (IMO) najnowszy model uzyskał 83 proc. trafnych odpowiedzi, podczas gdy jego poprzednik, GPT-4o, tylko 13 proc.