ÎÄÕÂ
  • ÎÄÕÂ
搜索

ÂÛ̳Ê×Ò³>>ChatGPT>>ΪʲôËùÓÐGPT-3¸´ÏÖ¶¼Ê§°ÜÁË£¿Ê¹ ...

¹²1Ò³Ê×Ò³ÉÏÒ»Ò³1ÏÂһҳβҳ
QQ2654704327
µÈ¼¶£ºÆÕͨ»áÔ±
Í·ÏΣº ÂÛ̳ԪÀÏ
ÐÇÊý£º
ÌûÊý£º517
¾«»ª£º0
»ý·Ö£º1041
ÏûÏ¢£º
  ²é¿´×ÊÁÏ
·¢²¼ÓÚ£º2023-06-21 22:14
×ÖÌå´óС£º´óÖÐС 1#

ΪʲôËùÓÐGPT-3¸´ÏÖ¶¼Ê§°ÜÁË£¿Ê¹ÓÃChatGPTÄãÓ¦¸ÃÖªµÀÕâЩ

ΪʲôËùÓй«¿ªµÄ¶Ô GPT-3 µÄ¸´ÏÖ¶¼Ê§°ÜÁË£¿ÎÒÃÇÓ¦¸ÃÔÚÄÄЩÈÎÎñÉÏʹÓà GPT-3.5 »ò ChatGPT£¿


ÕâÒ»ÍÆÎÄдÓÚ 2023 Äê 2 Ô 12 ÈÕ£¬ÆäÖоùΪ¸öÈËÒâ¼û£¬½ö¹©²Î¿¼¡£

ΪʲôËùÓй«¿ªµÄ¶Ô GPT-3 µÄ¸´ÏÖ¶¼Ê§°ÜÁË£¿ÎÒÃÇÓ¦¸ÃÔÚÄÄЩÈÎÎñÉÏʹÓà GPT-3.5 »ò ChatGPT£¿

ÕâÆªÍÆÎĽ«°üÀ¨£¬ÎÒÔÚ×ÐÏ¸ÖØÐ¼ì²éÁËһϵÁÐÎÄÕµÄϸ½ÚÖ®ºó¸ø³öµÄ×ܽᣬÒÔ¼°¶ÔÉÏÃæÁ½¸öÎÊÌâÎÒ¸öÈ˵Ä˼¿¼¡£ÕâЩÎÄÕ°üÀ¨ÇÒ²»ÏÞÓÚ£ºGPT-3, PaLM, BLOOM, OPT, FLAN-T5/PaLM, HELM µÈ¡£Èç¹ûÄúÓиü¿É¿¿µÄ²Î¿¼×ÊÁÏ»òÕ߸üʵ¼ÊµÄ¾­Ñ飬»¶Ó­Ö¸Õý¡£

¶ÔÓÚÄÇЩÏëÒª¸´ÏÖÒ»¸öÊôÓÚ×Ô¼ºµÄ GPT-3 »ò ChatGPT µÄÈ˶øÑÔ£¬µÚÒ»¸öÎÊÌâÊǹؼüµÄ¡£µÚ¶þ¸öÎÊÌâÔò¶ÔÄÇЩÏëҪʹÓÃËüÃǵÄÈËÊÇÖØÒªµÄ£¨ÏÂÎÄÌáµ½ GPT-3£¬Ö÷ÒªÊÇÖ¸ GPT-3.5 »ò InstructGPT µÄ×îа汾£¬³ýÁËһЩָÏò GPT-3 Ô­ÎĵÄÇé¿ö£©¡£

ΪʲôËùÓй«¿ªµÄ¶Ô GPT-3 µÄ¸´ÏÖ¶¼Ê§°ÜÁË£¿

ÕâÀÎÒ³ÆÖ®Îª ¡°Ê§°Ü¡±£¬ÊÇָѵÁ·µÃ³öÄ£ÐÍÓнӽü GPT-3 »òÕ߸ü´óµÄ²ÎÊýÁ¿£¬µ«ÈÔÎÞ·¨Óë GPT-3 ԭʼÎÄÏ×Öб¨¸æµÄÐÔÄÜËùÆ¥Åä¡£ÔÚÕâÒ»±ê׼ϣ¬GPT-3 ºÍ PaLM ÊÇ ¡°³É¹¦¡± µÄ£¬µ«ÕâÁ½¸öÄ£ÐͶ¼²»Êǹ«¿ªµÄ¡£¶øËùÓеĹ«¿ªÄ£ÐÍ£¨ÀýÈ磺OPT-175B ºÍ BLOOM-176B£©¶¼ÔÚÒ»¶¨³Ì¶ÈÉÏ ¡°Ê§°Ü¡± ÁË¡£µ«ÊÇÎÒÃÇÈÔÈ»¿ÉÒÔ´ÓÕâЩ ¡°Ê§°Ü¡± ÖÐÎüȡһЩ½Ìѵ¡£

ÎÒÃÇÐèҪעÒâµÄÊÇ£¬¼ÙÈçÄܹ»¶à´Î³¢ÊÔ¸÷ÖÖ²»Í¬µÄѵÁ·ÉèÖ㬿ªÔ´ÉçÇø¿ÉÄÜ×îÖÕ¿ÉÒÔ¸´ÏÖ GPT-3¡£µ«½ØÖÁĿǰ£¬ÑµÁ·ÁíÒ»¸ö°æ±¾µÄ OPT-175B µÄ¿ªÏúÈÔȻ̫¹ý¸ß°º ¡ª¡ª ¶ÔÓÚÈç´Ë´ó¹æÄ£µÄÄ£ÐÍ£¬Ò»´ÎѵÁ·¾Í½«ÐèÒªÔÚÔ¼ 1000 ¸ö 80G A100 GPU ÉÏ»¨·ÑÖÁÉÙ 2 ¸öÔµÄʱ¼ä£¨Êý¾ÝÀ´×ÔÓÚ OPT µÄԭʼÎÄÏ×£©¡£

¾¡¹ÜһЩÎÄÕ£¨ÀýÈç OPT-175B ºÍ GLM-130B£©Éù³ÆËüÃÇÔÚһЩÈÎÎñÉÏÄܹ»Æ¥ÅäÉõÖÁ³¬¹ýԭʼµÄ GPT-3 µÄ±íÏÖ£¬ÔÚ¸ü¶à GPT-3 ÒѾ­²âÊÔ¹ýµÄÈÎÎñÉÏ£¬ÕâÖÖÉùÃ÷ÈÔÈ»ÊÇ´æÒɵġ£Í¬Ê±£¬¸ù¾Ý´ó¶àÊýʹÓÃÕßÔÚ¸ü¶àÑùµÄÈÎÎñÉϵľ­Ñ飬ÒÔ¼° HELM µÄÆÀ¹ÀÀ´¿´£¬×î½üµÄ OpenAI GPT-3 µÄ API ±íÏÖÒ²ÈÔÈ»±ÈÕâЩ¿ªÔ´Ä£Ð͸üºÃ¡£

¾¡¹ÜËü±³ºóµÄÄ£ÐÍ¿ÉÄÜʹÓÃÁËÖ¸Áî΢µ÷£¨instruction tuning, ÕýÈç InstructGPT ÄÇÑù£©£¬ÀàËÆµÄʹÓÃÁËÖ¸Áî΢µ÷µÄ OPT °æ±¾£¨OPT-IML£©ºÍ BLOOM °æ±¾£¨BLOOMZ£©Ò²ÈÔȻԶ±È InstructGPT ºÍ FLAN-PaLM£¨PaLM µÄÖ¸Áî΢µ÷°æ±¾£©Òª²îµÃ¶à¡£

¸ù¾ÝÎÄÕµÄϸ½Ú£¬Óжà¸ö¿ÉÄܵÄÔ­Òòµ¼ÖÂÁËÏà±È GPT-3 ºÍ PaLM µÄ³É¹¦£¬OPT-175B ºÍ BLOOM-176B µÄʧ°Ü¡£ÎÒ½«Æä·ÖΪÁ½¸ö²¿·Ö£ºÔ¤ÑµÁ·Êý¾ÝºÍѵÁ·²ßÂÔ¡£

ԤѵÁ·Êý¾Ý

ÈÃÎÒÃÇÊ×Ïȹ۲ì GPT-3 ÊÇÈçºÎ×¼±¸ºÍʹÓÃԤѵÁ·Êý¾ÝµÄ¡£GPT-3 ÔÚ¹²¼Æ 300B µÄ token ÉϽøÐÐѵÁ·£¬ÆäÖÐ 60% À´×Ô¾­¹ýɸѡµÄ Common Crawl£¬ÆäËüÔòÀ´×Ô£ºwebtext2£¨ÓÃÓÚѵÁ· GPT-2 µÄÓïÁϿ⣩£¬Books1£¬Books2 ºÍ*¡£

¸üа汾µÄ GPT-3 »¹ÓÃÁË´úÂëÊý¾Ý¼¯½øÐÐѵÁ·£¨ÀýÈç Github Code£©¡£Ã¿¸ö²¿·ÖµÄÕ¼±È²¢²»ÓëÓëԭʼÊý¾Ý¼¯µÄ´óС³É±ÈÀý£¬Ïà·´µÄ£¬¾ßÓиü¸ßÖÊÁ¿µÄÊý¾Ý¼¯±»¸ü¼ÓƵ·±µØ²ÉÑù¡£µ¼Ö OPT-175B ºÍ BLOOM-176B ʧ°ÜµÄ£¬¿ÉÄÜÊÇÒÔÏÂÈý¸öÄѵ㣬ËüÃÇʹµÃ¿ªÔ´ÉçÇøÄÑÒÔÊÕ¼¯µ½ÀàËÆµÄÊý¾Ý£º

1. µÚÒ»µãÊÇÒ»¸ö¾ßÓÐÁ¼ºÃÐÔÄܵÄÓÃÓÚɸѡµÍÖÊÁ¿Êý¾ÝµÄ·ÖÀàÆ÷¡£Ëü±»ÓÃÓÚ¹¹½¨ GPT-3 ºÍ PaLM µÄԤѵÁ·Êý¾Ý¼¯£¬µ«ÔÚ OPT ºÍ BLOOM µÄѵÁ·ÖÐȴûÓб»²ÉÓá£Ò»Ð©ÎÄÕÂÒѾ­Õ¹Ê¾£¬Ò»¸öÓøüÉÙµ«ÖÊÁ¿¸ü¸ßµÄÊý¾Ý¼¯ÑµÁ·µÄԤѵÁ·Ä£ÐÍ£¬¿ÉÒÔÔÚÐÔÄÜÉϳ¬¹ýÁíÒ»¸öÓøü¶àµÄ»ìºÏÖÊÁ¿Êý¾Ý¼¯ÑµÁ·µÄÄ£ÐÍ¡£µ±È»£¬Êý¾ÝµÄ¶àÑùÐÔÈÔÈ»ÊÇÊ®·ÖÖØÒªµÄ£¬ÕýÈçÎÒÃǽ«ÔÚµÚÈýµãÖÐÌÖÂ۵ġ£Òò´Ë£¬ÈËÃÇÓ¦µ±·Ç³£Ð¡Ðĵش¦ÀíÔÚÊý¾Ý¶àÑùÐÔºÍÖÊÁ¿Ö®¼äµÄȨºâ¡£

2. µÚ¶þµãÊÇԤѵÁ·Êý¾Ý¼¯µÄÈ¥ÖØ¡£È¥ÖØÓÐÖúÓÚ±ÜÃâԤѵÁ·Ä£ÐͶà´ÎÃæ¶ÔÏàͬµÄÊý¾Ýºó¼ÇסËüÃÇ»òÕßÔÚÆäÉϹýÄâºÏ£¬Òò´ËÓÐÖúÓÚÌá¸ßÄ£Ð͵ķº»¯ÄÜÁ¦¡£GPT-3 ºÍ PaLM ²ÉÓÃÁËÎĵµ¼¶±ðµÄÈ¥ÖØ£¬ÕâͬÑù±» OPT Ëù²ÉÓᣵ« OPT ԤѵÁ·µÄÈ¥ÖØ Pile ÓïÁÏ¿âÖÐÈÔÓÐÐí¶àÖØ¸´´æÔÚ£¬ÕâÒ²¿ÉÄܵ¼ÖÂËü½Ï²îµÄÐÔÄÜ£¨×¢£ºÔÚһЩ×î½üµÄÎÄÏ×ÖÐÏÔÊ¾È¥ÖØ¶ÔÓÚԤѵÁ·ÓïÑÔÄ£Ð͵ÄÖØÒªÐÔ¿ÉÄÜûÓÐÏëÏóÖд󣩡£

3. µÚÈýµãÊÇԤѵÁ·Êý¾Ý¼¯µÄ¶àÑùÐÔ£¬°üÀ¨ÁìÓò¶àÑùÐÔ¡¢¸ñʽ¶àÑùÐÔ£¨ÀýÈ磺Îı¾¡¢´úÂëºÍ±í¸ñ£©ºÍÓïÑÔ¶àÑùÐÔ¡£OPT-175B ËùʹÓÃµÄ Pile ÓïÁÏ¿âÉù³ÆÓÐןüºÃµÄ¶àÑùÐÔ£¬µ« BLOOM ²ÉÓÃµÄ ROOTS ÓïÁÏ¿âÔòÓÐÌ«¶àµÄÒѾ­´æÔÚµÄѧÊõÊý¾Ý¼¯£¬È±·¦ Common Crawl Êý¾ÝËù°üº¬µÄ¶àÑùÐÔ¡£Õâ¿ÉÄܵ¼Ö BLOOM ÐÔÄܸü²î¡£×÷Ϊ¶Ô±È£¬GPT3 À´×Ô Common Crawl ÓïÁϵÄÕ¼±ÈÔòÒª¸ßµÃ¶à£¬¶øËüÃÇÊǶàÑùµÄºÍÀ´×Թ㷺ÁìÓòµÄ£¬ÕâÒ²¿ÉÄÜÊÇ GPT-3 Äܹ»×÷ΪÊ׸öͨÓÃÁÄÌì»úÆ÷ÈË ChatGPT µÄ»ù´¡Ä£Ð͵ÄÔ­ÒòÖ®Ò»¡£

Çë×¢Ò⣺ËäȻһ°ãÀ´Ëµ£¬¶àÑùÐÔµÄÊý¾Ý¶ÔÓÚѵÁ·Ò»¸öͨÓÃµÄ LLM£¨Large Language Model£¬´ó¹æÄ£ÓïÑÔÄ£ÐÍ£©ÊÇÖØÒªµÄ£¬µ«Ìض¨µÄԤѵÁ·Êý¾Ý·Ö²¼£¬Ôò»á¶Ô LLM ÔÚÌØ¶¨µÄÏÂÓÎÈÎÎñÉϵÄÐÔÄܲúÉú¾Þ´óµÄÓ°Ïì¡£ÀýÈ磬BLOOM ºÍ PaLM ÔÚ¶àÓïÑÔÊý¾ÝÉÏÓиü¸ßµÄÕ¼±È£¬Õâµ¼ÖÂËüÃÇÔÚһЩ¶àÓïÑÔÈÎÎñºÍ»úÆ÷·­ÒëÈÎÎñÉϵÄÐÔÄܸü¸ß¡£

OPT ʹÓÃÁ˺ܶà¶Ô»°Êý¾Ý£¨ÀýÈç reddit£©£¬Õâ¿ÉÄÜÊÇËüÔÚ¶Ô»°ÖбíÏֺõÄÔ­ÒòÖ®Ò»¡£PaLM ÓкܴóµÄÕ¼±ÈÔÚÉ罻ýÌå¶Ô»°ÖУ¬Õâ¿ÉÄÜÊÇËüÔÚ¶àÖÖÎÊ´ðÈÎÎñºÍÊý¾Ý¼¯ÉÏÓÐ×Å׿Խ±íÏÖµÄÔ­Òò¡£Í¬ÑùµÄ£¬PaLM ºÍ¸üа汾µÄ GPT-3 ÓкÜ*ÀýµÄ´úÂëÊý¾Ý¼¯£¬ÕâÔöÇ¿ÁËËüÃÇÔÚ´úÂëÈÎÎñÉϵÄÄÜÁ¦£¬ÒÔ¼°¿ÉÄÜÔöÇ¿ÁËËüÃÇ CoT (Chain-of-Thought£¬Ë¼Î¬Á´) µÄÄÜÁ¦¡£

Ò»¸öÓÐȤµÄÏÖÏóÊÇ BLOOM ÔÚ´úÂëºÍ CoT ÉϵıíÏÖÈÔÈ»ÊǽϲîµÄ£¬¾¡¹ÜËüÔÚԤѵÁ·¹ý³ÌÖÐʹÓÃÁË´úÂëÊý¾Ý¡£Õâ¿ÉÄܰµÊ¾×ŵ¥¶À´úÂëÊý¾Ý±¾Éí£¬²¢²»Äܱ£Ö¤Ä£Ð͵ĴúÂëºÍ CoT ÄÜÁ¦¡£

×ÜÖ®£¬Ò»Ð©ÎÄÕ±íÃ÷ÁËÉÏÃæÈýµãµÄÖØÒªÐÔ£¬¼´£ºÍ¨¹ýÊý¾ÝÈ¥ÖØ±ÜÃâ¼ÇÒäºÍ¹ýÄâºÏ£¬Í¨¹ýÊý¾ÝɸѡÒԵõ½¸ßÖÊÁ¿Êý¾Ý£¬±£Ö¤Êý¾Ý¶àÑùÐÔÒÔÈ·±£ LLM µÄ·º»¯ÐÔ¡£µ«²»ÐÒµÄÊÇ£¬¶ÔÓÚ PaLM ºÍ GPT-3 Ô¤´¦ÀíÕâЩÊý¾ÝµÄϸ½Ú£¬»òÕßÕâЩԤѵÁ·Êý¾Ý±¾Éí£¬ÈÔȻûÓй«²¼£¬ÕâʹµÃ¹«¹²ÉçÇøºÜÄÑÈ¥¸´ÏÖËüÃÇ¡£

ѵÁ·²ßÂÔ

´Ë´¦ÑµÁ·²ßÂÔ°üÀ¨ÑµÁ·¿ò¼Ü¡¢ÑµÁ·³ÖÐøÊ±¼ä¡¢Ä£Ðͼܹ¹ / ѵÁ·ÉèÖá¢ÑµÁ·¹ý³ÌÖеÄÐ޸ġ£ÔÚѵÁ··Ç³£´óµÄÄ£ÐÍʱ£¬ËüÃDZ»ÓÃÓÚ»ñµÃ¸üºÃµÄÎȶ¨ÐÔºÍÊÕÁ²ÐÔ¡£Ò»°ãÀ´Ëµ£¬ÓÉÓÚδ֪µÄÔ­Òò£¬Ô¤ÑµÁ·¹ý³ÌÖй㷺¹Û²ìµ½Ëðʧ¼â·å£¨loss spike£©ºÍÎÞ·¨ÊÕÁ²µÄÇé¿ö¡£Òò´Ë£¬ÖÚ¶àµÄ¶ÔѵÁ·ÉèÖúÍÄ£Ðͼܹ¹µÄÐ޸ı»Ìá³ö£¬ÓÃÒÔ±ÜÃâÕâЩÎÊÌâ¡£µ«ÊÇÆäÖÐһЩÐÞ¸ÄÔÚ OPT ºÍ BLOOM Ö®Öл¹²»ÊÇ×îÓŽ⣬Õâ¿ÉÄܵ¼ÖÂËüÃǵÄÐÔÄܽϲGPT-3 ²¢Ã»ÓÐÃ÷È·Ìáµ½ËûÃÇÊÇÈçºÎ½â¾öÕâ¸öÎÊÌâµÄ¡£

1. ѵÁ·¿ò¼Ü¡£Ò»¸ö²ÎÊýÁ¿´óÓÚ 175B µÄÄ£ÐÍÍùÍùÐèÒª ZeRO ʽµÄÊý¾Ý²¢ÐУ¨·Ö²¼Ê½µÄÓÅ»¯Æ÷£©ºÍÄ£ÐͲ¢ÐУ¨°üÀ¨ÕÅÁ¿²¢ÐУ¨tensor parallel£©¡¢Á÷Ë®Ïß²¢ÐУ¨pipeline parallel£©£¬ÓÐʱ»¹°üÀ¨ÐòÁв¢ÐУ¨sequence parallel£©£©¡£OPT ²ÉÓÃÁË ZeRO µÄ FSDP ʵÏÖ£¬ÒÔ¼°Ä£ÐͲ¢ÐÐµÄ Megatron-LM ʵÏÖ¡£BLOOM ²ÉÓÃÁË ZeRO µÄ Deepspeed ʵÏÖºÍÄ£ÐͲ¢ÐÐµÄ Megatron-LM ʵÏÖ¡£

PaLM ²ÉÓÃÁË Pathways£¬ÕâÊÇÒ»¸ö»ùÓÚ TPU µÄÄ£ÐͲ¢ÐкÍÊý¾Ý²¢ÐÐϵͳ¡£GPT-3 µÄѵÁ·ÏµÍ³µÄϸ½ÚÈÔȻδ֪£¬µ«ËüÃÇÖÁÉÙÔÚÒ»¶¨³Ì¶ÈÉÏʹÓÃÁËÄ£ÐͲ¢ÐУ¨Ò»Ð©È˳ÆËüʹÓÃÁË Ray£©¡£²»Í¬µÄѵÁ·ÏµÍ³ºÍÓ²¼þ¿ÉÄܵ¼Ö²»Í¬µÄѵÁ·Ê±µÄÏÖÏó¡£ÏÔÈ»£¬Ò»Ð©ÔÚ PaLM µÄÎÄÕÂÖгÊÏֵġ¢ÓÃÓÚ TPU ѵÁ·µÄÉèÖ㬿ÉÄܲ¢²»ÊÊÓÃÓÚÆäËüËùÓÐÄ£ÐÍʹÓÃµÄ GPU ѵÁ·¡£

Ó²¼þºÍѵÁ·¿ò¼ÜµÄÒ»¸öÖØÒªµÄÓ°ÏìÊÇ£¬ÈËÃÇÊÇ·ñ¿ÉÒÔʹÓà bfloat16 È¥´æ´¢Ä£ÐÍÈ¨ÖØºÍÖмä²ã¼¤»îÖµµÈ¡£ÕâÒѾ­±»Ö¤Ã÷ÊÇÎȶ¨ÑµÁ·µÄÒ»¸öÖØÒªÒòËØ£¬ÒòΪ bfloat16 ¿ÉÒÔ±íʾ¸ü´ó·¶Î§µÄ¸¡µãÊý£¬Äܹ»´¦ÀíÔÚËðʧ¼â·åʱ³öÏֵĴóÊýÖµ¡£ÔÚ TPU ÉÏ bfloat16 ÊÇĬÈÏÉèÖã¬Õâ¿ÉÄÜÊÇ PaLM Äܹ»³É¹¦µÄÒ»¸öÃØÃÜ¡£µ«ÊÇÔÚ GPU ÉÏ£¬ÒÔǰÈËÃÇÖ÷ҪʹÓà float16£¬ÕâÊÇ V100 ÖлìºÏ¾«¶ÈѵÁ·µÄΨһѡÔñ¡£

OPT ʹÓÃÁË float16£¬Õâ¿ÉÄÜÊÇÆä²»Îȶ¨µÄÒòËØÖ®Ò»¡£BLOOM ·¢ÏÖÁËÕâÑùµÄÎÊÌâ²¢×îÖÕÔÚ A100GPU ÉÏʹÓÃÁË bfloat16£¬µ«ËüûÓÐÒâʶµ½ÕâÖÖÉèÖõÄÖØÒªÐÔ£¬Òò´ËÔÚµÚÒ»¸ö´ÊÏòÁ¿²ãºóÒýÈë¶îÍâµÄ²ã¹éÒ»»¯£¨layer normalization£©£¬ÓÃÓÚ½â¾öËûÃÇʹÓà float16 µÄ³õ²½ÊµÑéÖеIJ»Îȶ¨ÐÔ¡£È»¶ø£¬ÕâÖÖ²ã¹éÒ»»¯Òѱ»Ö¤Ã÷»áµ¼Ö¸üÔã¸âµÄÁãÑù±¾·º»¯£¨zero-shot generalization£©£¬Õâ¿ÉÄÜÊÇ BLOOM ʧ°ÜµÄÒ»¸öÒòËØ¡£

2. ѵÁ·¹ý³ÌÖеÄÐ޸ġ£OPT ×öÁ˺ܶàÖÐ;µ÷Õû²¢´Ó×î½üµÄ checkpoint ÖØÆôѵÁ·£¬°üÀ¨¸Ä±ä½Ø¶ÏÌݶȷ¶Êý (clip gradient norm) ºÍѧϰÂÊ£¬Çл»µ½¼òµ¥µÄ SGD ÓÅ»¯Æ÷È»ºó»Øµ½ Adam£¬ÖØÖö¯Ì¬Ëðʧ±êÁ¿ (dynamic loss scalar)£¬Çл»µ½¸üа汾µÄ Megatron µÈµÈ¡£

ÕâÖÖÖÐ;µ÷Õû¿ÉÄÜÊÇ OPT ʧ°ÜµÄÔ­ÒòÖ®Ò»¡£Ïà±È֮ϣ¬PaLM ¼¸ºõûÓÐ×öÈκÎÖÐ;µ÷Õû¡£ËüÖ»Êǵ±Ëðʧ¼â·å³öÏÖʱ£¬´Ó¼â·å¿ªÊ¼Ç°´óÔ¼ 100 ²½µÄ checkpoint ÖØÐ¿ªÊ¼ÑµÁ·£¬²¢Ìø¹ýÁË´óÔ¼ 200-500 ¸ö batch µÄÊý¾Ý¡£½ö½öÒÀ¿¿ÕâÖÖ¼òµ¥µÄÖØÆô£¬PaLM ¾ÍÈ¡µÃÉñÆæµÄ³É¹¦¡£ÕâÊÇÓÉÓÚËüÔÚԤѵÁ·Êý¾Ý¹¹½¨ÆÚ¼ä¾ÍÒѾ­Íê³É²ÉÑù£¬Òò´ËÄ£Ð;ßÓÐÔÚ Bit ÒâÒåÉϵÄÈ·¶¨ÐÔ£¬ÒÔ¼°Ëü¶ÔÄ£Ðͼܹ¹ºÍѵÁ·ÉèÖýøÐÐÁËÐí¶àÐÞ¸ÄÒÔ»ñµÃ¸üºÃµÄÎȶ¨ÐÔ¡£PaLM ÖеĴËÀàÐÞ¸ÄÔÚÏÂÒ»µãÖÐչʾ¡£

3. Ä£Ðͼܹ¹ / ѵÁ·ÉèÖãºÎªÁËʹѵÁ·¸üÎȶ¨£¬PaLM ¶ÔÄ£Ðͼܹ¹ºÍѵÁ·ÉèÖýøÐÐÁ˶àÏîµ÷Õû£¬°üÀ¨Ê¹Óà Adafactor µÄÐ޸İ汾×÷ΪÓÅ»¯Æ÷£¬Ëõ·ÅÔÚ softmax ֮ǰµÄÊä³ö logit£¬Ê¹Óø¨ÖúËðʧÀ´¹ÄÀø softmax ¹éÒ»»¯Æ÷½Ó½ü 0£¬¶Ô´ÊÏòÁ¿ºÍÆäËû²ãÈ¨ÖØÊ¹Óò»Í¬µÄ³õʼ»¯£¬ÔÚǰÀ¡²ãºÍ²ã¹éÒ»»¯Öв»Ê¹ÓÃÆ«²îÏ²¢ÇÒÔÚԤѵÁ·ÆÚ¼ä²»Ê¹Óà dropout¡£

Çë×¢Ò⣬GLM-130B Öл¹Óиü¶àÓмÛÖµµÄÄÚÈݹØÓÚÈçºÎÎȶ¨µØÑµÁ··Ç³£´óµÄÄ£ÐÍ£¬ÀýÈ磺ʹÓûùÓÚ DeepNorm µÄºóÖòã¹éÒ»»¯¶ø²»ÊÇǰÖòã¹éÒ»»¯£¬ÒÔ¼°´ÊÏòÁ¿²ãÌݶÈÊÕËõ¡£ÒÔÉÏ´ó¶àÊýÄ£ÐÍÐÞ¸ÄûÓб» OPT ºÍ BLOOM ²ÉÓã¬Õâ¿ÉÄܻᵼÖÂËüÃǵIJ»Îȶ¨ºÍʧ°Ü¡£

4. ѵÁ·¹ý³Ì£ºÈçϱíËùʾ£¬Ô­Ê¼µÄ GPT-3 ԤѵÁ·¹ý³Ì¼û¹ýµÄ token ÊýÓë OPT ºÍ BLOOM ½Ó½ü£¬¶ø PaLM ÔòÔ¶Ô¶³¬¹ýÁËËüÃÇ¡£Í¬Ñù£¬PaLM ºÍ GPT-3 ԤѵÁ·ÓïÁϿⶼ´óÓÚ BLOOM ºÍ OPT¡£Òò´Ë£¬ÔÚ¸ü¶àµÄ token ÉÏ¡¢Óøü´ó¹æÄ£µÄ¸ßÖÊÁ¿ÓïÁÏ¿â½øÐÐԤѵÁ·¿ÉÄÜÊÇ GPT-3 ºÍ PaLM ³É¹¦µÄÒ»¸öÖØÒªÒòËØ¡£



³ýÁËÉÏÃæÁгöµÄËĵ㣬»¹ÓÐһЩÆäËüÒòËØ£¬ËüÃÇ¿ÉÄܶÔÓÚ¸üÎȶ¨µÄѵÁ·²¢²»ÖØÒª£¬µ«ÈÔÈ»¿ÉÄÜÓ°Ïì×îÖÕµÄÐÔÄÜ¡£

µÚÒ»µã£¬PaLM ºÍ GPT-3 ¶¼Ê¹ÓÃÁËÔÚѵÁ·¹ý³ÌÖдÓСµ½´óÖð½¥Ôö¼ÓµÄ batch size£¬ÕâÒѾ­±»Õ¹Ê¾¶ÔÓÚѵÁ·Ò»¸ö¸üºÃµÄ LLM ÊÇÓÐЧµÄ£¬È»¶ø OPT ºÍ BLOOM ¶¼Ê¹ÓÃÁ˺㶨µÄ batch size¡£

µÚ¶þµã£¬OPT ʹÓÃÁË ReLU ¼¤»îº¯Êý£¬¶ø PaLM ʹÓà SwiGLU ¼¤»îº¯Êý£¬GPT-3 ºÍ BLOOM ʹÓà GeLU£¬Ëüͨ³£Ê¹µÃѵÁ·µÄ LLM µÄÐÔÄܸüºÃ¡£

µÚÈýµã£¬ÎªÁ˸üºÃµÄ½¨Ä£¸ü³¤µÄÐòÁУ¬PaLM ʹÓà RoPE ´ÊÏòÁ¿£¬BLOOM ʹÓà ALiBi ´ÊÏòÁ¿£¬¶øÔ­Ê¼µÄ GPT-3 ºÍ OPT ʹÓÃѧϰµÃµ½µÄ´ÊÏòÁ¿£¬Õâ¿ÉÄÜÓ°ÏìÔÚ³¤ÐòÁÐÉϵÄÐÔÄÜ¡£

ÎÒÃÇÓ¦¸ÃÔÚÄÄЩÈÎÎñÉÏʹÓà GPT-3.5 »ò ChatGPT£¿

ÎÒ³¢ÊÔ½âÊÍÎÒÃÇÓ¦¸ÃÔÚÄÄЩÈÎÎñºÍÓ¦ÓÃÉÏʹÓà GPT-3£¬¶øÄÄЩÔò²»¸ÃʹÓá£ÎªÁËչʾ GPT-3 ÊÇ·ñÊʺÏij¸öÌØ¶¨ÈÎÎñ£¬ÎÒÖ÷Òª±È½ÏÁË´øÓÐÌáʾ£¨prompting£©µÄ GPT-3 ºÍ¾­¹ý΢µ÷µÄ¸üСµÄÄ£ÐÍ£¬ÕâЩСģÐÍÓÐʱ»¹¼ÓÈëÁËÆäËûÌØÊâµÄÉè¼Æ¡£¼øÓÚ×î½ü³öÏֵĸüСµÄ¶øÇÒ¿ÉÒÔ΢µ÷µÄ FLAN-T5 Ä£Ð͵ÄÁ¼ºÃÐÔÄÜ£¬ÕâÒ»ÎÊÌâ¸ü¼ÓÖØÒª¡£

ÔÚÀíÏëÇéÐÎÏ£¬Èç¹û΢µ÷ GPT-3 µÄ¸ºµ£ÊÇÄܹ»³Ðµ£µÄ£¬Ëü¿ÉÄÜ´øÀ´¸ü½øÒ»²½µÄÌáÉý¡£È»¶ø£¬ÔÚһЩÈÎÎñÉÏͨ¹ý΢µ÷ PaLM-540B ´øÀ´µÄÌáÉýÊÇÈç´ËÓÐÏÞ£¬ÈÃÈËÃÇ»³ÒÉÔÚһЩÈÎÎñÖÐ΢µ÷ GPT-3 ÊÇ·ñÊÇÖµµÃµÄ¡£´Ó¿ÆÑ§µÄ½Ç¶ÈÀ´¿´£¬¸ü¹«Æ½µÄ±È½ÏÓ¦ÔÚ΢µ÷ GPT-3 ºÍÌáʾ GPT-3 Ö®¼ä½øÐС£È»¶ø£¬ÒªÊ¹Óà GPT-3£¬ÈËÃÇ¿ÉÄܸü¹ØÐĽ«Ìáʾ GPT-3 ºÍ΢µ÷Ò»¸ö¸üСµÄÄ£ÐÍÈ¥½øÐжԱȡ£

×¢Òâµ½£¬ÎÒÖ÷Òª¹ØÐĵÄÊǽ«Íê³ÉÈÎÎñµÄ¾«È·¶È×÷Ϊ¶ÈÁ¿£¬µ«ÈÔÈ»´æÔںܶàÆäËüÖØÒªµÄά¶È£¬ÀýÈ磺Óк¦ÐÔ£¨toxicity£©¡¢¹«Æ½ÐԵȣ¬ËüÃÇÒ²Ó¦¸ÃÔÚ¾ö¶¨ÊÇ·ñʹÓà GPT-3 ʱ±»ÄÉÈ뿼ÂÇ£¬ÕýÈç HELM µÄÎÄÕÂÖÐËù³ÊÏֵġ£ÏÂͼչʾÁËÒ»¸ö´ÖÂԵľö²ßÁ÷³Ì£¬Ï£ÍûËüÄܹ»×÷Ϊһ¸öÓÐÓõÄʵ¼ùÖ¸ÄÏ£¬ÎÞÂÛ¶ÔÓÚÒÑÓÐÈÎÎñ»¹ÊÇÒ»¸öȫеÄÈÎÎñ¡£



×¢ 1£ºÓÉÓÚÔÚ¶Ô»°³¡¾°ÏµÄÁ¼ºÃ¶ÔÆë£¬ChatGPT ×÷Ϊһ¸öÁÄÌì»úÆ÷È˱íÏÖÓÅÒì¡£µ«ÎÒÃÇͨ³£Ê¹Óà GPT-3¡¢InstructGPT (GPT-3.5)¡¢ÒÔ¼° Codex ÕâЩ ChatGPT ±³ºóµÄÄ£ÐÍ×÷ΪÔÚ¸ü¶àÈÎÎñºÍʹÓ󡾰ϵÄͨÓÃÄ£ÐÍ¡£

×¢ 2£ºÕâÒ»½ÚÖеĽáÂÛÊÇ»ùÓÚһЩ¶ÔÄ£Ð͵±Ç°°æ±¾µÄ·¢Ïֵõ½µÄ£¬Õâ¿ÉÄܲ»ÊÊÓÃÓÚδÀ´µÄ¸üÇ¿µÄÄ£ÐÍ¡£ÒòΪ£¬Ê¹Óøü¶àÓëÄ¿±êÊý¾Ý¼¯½Ó½üµÄԤѵÁ·Êý¾Ý¡¢Ñ§ÊõÊý¾Ý¼¯Ö¸Áîµ÷Õû£¨ÀýÈçÌáʾһ¸ö FLAN-PaLM ¿ÉÄÜ»á´øÀ´¸üÇ¿µÄÐÔÄÜ£¬ËüÈÔδ¹«¿ª£©»òÕßͨ¹ý RLHF ÒÔʹµÃÄ£ÐͶÔÄ¿±êÈÎÎñµÄ¸üºÃ¶ÔÆë£¬ÕâЩ¶¼¿ÉÄÜʹµÃÄ£ÐÍÔÚÄ¿±êÈÎÎñÖбíÏÖ¸üºÃ£¬¼´Ê¹ÓÐʱÕâ»áÎþÉüÔÚÆäËû³¡¾°ÏµÄÄÜÁ¦£¨ÀýÈ磬InstructGPT µÄ ¡°¶ÔÆë˰ / Alignment tax¡±£©¡£

ÔÚÕâÖÖÇé¿öÏ£¬ºÜÄÑÅÐ¶Ï GPT ÊǽøÐзº»¯ºÍ¿çÈÎÎñ·º»¯£¬»¹Êǽö½öÔÚԤѵÁ·Ê±¾ÍÒѾ­¼ÇסÁËһЩ²âÊÔÑùÀý£¬»òÕß˵¼û¹ýÄÇЩÔÚԤѵÁ·Ê±Ëùν ¡°Ã»Óмû¹ý¡± µÄÈÎÎñ¡£È»¶ø£¬¼ÇÒäÔÚʵ¼ùÖÐÊÇ·ñÕæµÄÊÇÒ»¸öÑÏÖØµÄÎÊÌ⣬ÕâÈÔȻֵµÃ»³ÒÉ¡£ÒòΪÓû§ÓëÑо¿ÈËÔ±²»Í¬£¬Èç¹ûËûÃÇ·¢ÏÖ GPT ÒѾ­¿ÉÒÔÔÚËûÃǵIJâÊÔÊý¾ÝÉϱíÏÖÁ¼ºÃ£¬ËûÃÇ¿ÉÄܲ»»á¹ØÐÄ GPT ÔÚԤѵÁ·ÆÚ¼äÊÇ·ñ¿´µ½ÁËÏàͬ»òÏàËÆµÄÊý¾Ý¡£

²»ÂÛÈçºÎ£¬ÎªÁË×î´ó»¯ÕâÒ»½ÚÔÚµ±Ç°µÄʵÓüÛÖµ£¬ÎÒ¾¡×î´óŬÁ¦£¬ÊÔͼ±È½Ï΢µ÷¹«¹²µÄ¸üСÐ͵ÄÄ£ÐÍ£¨T5¡¢FALN-T5¡¢Ò»Ð©ÌØÊâÉè¼ÆµÄ΢µ÷ SOTA Ä£Ð͵ȣ©ºÍ×î½üµÄ GPT-3 (GPT-3.5¡¢InstructGPT)¡¢PaLM£¨»ò FLAN-PaLM£©µÄ×î¼ÑÐÔÄÜ£¬Èç¹ûÕâЩģÐ͵IJâÆÀÊý¾Ý¹»»ñµÃµÄ»°¡£

ÊʺÏʹÓÃGPT-3µÄÈÎÎñ

Ò»°ãÀ´Ëµ£¬ÓÐÒÔÏÂÕâЩÇé¿ö¸üÊʺÏʹÓÃÌáʾ GPT-3¡£ÁîÈ˾ªÑȵÄÊÇ£¬Èç¹ûÎÒÃǻؿ´ GPT-3 ÂÛÎĵĽéÉܲ¿·Ö£¬ÔÚÄÇÀïºÜ¶à³õʼÉè¼ÆÊ±µÄÄ¿±êº­¸ÇÁËÕâЩÈÎÎñ¡£ÕâÒâζ×ÅÄÇЩµ±³õºêΰµÄÄ¿±êÒѾ­±»²¿·ÖʵÏÖÁË¡£

1. ´´ÔìÐԺ͸´ÔÓµÄÈÎÎñ£º°üÀ¨´úÂ루´úÂ벹ȫ¡¢×ÔÈ»ÓïÑÔÖ¸ÁîÉú³É´úÂë¡¢´úÂë·­Òë¡¢bug ÐÞ¸´£©¡¢Îı¾ÕªÒª¡¢·­Òë¡¢´´ÔìÐÔд×÷£¨ÀýÈçд¹ÊÊ¡¢ÎÄÕ¡¢Óʼþ¡¢±¨¸æ£¬ÒÔ¼°Ð´×÷µÄ¸Ä½øµÈ£©¡£ÕýÈçԭʼµÄ GPT-3 ÎÄÏ×ÖÐËùʾ£¬GPT-3 ±»Éè¼ÆÓÃÓÚÄÇЩÀ§ÄÑºÍ ¡°²»¿ÉÄܱê×¢¡± µÄÈÎÎñ¡£ÔÚÒ»¶¨³Ì¶ÈÉÏ£¬¶ÔÓÚÕâЩÈÎÎñ£¬ÏÈǰÄÇÖÖ¾­¹ý΢µ÷µÄÄ£ÐͲ»¿ÉÄÜÓ¦ÓÃÓÚÕæÊµÊÀ½çµÄÓ¦Óã»¶ø GPT-3 ʹËüÃdzÉΪ¿ÉÄÜ¡£¾Ù¸öÀý×Ó£¬×î½üµÄÎÄÕÂÏÔʾ£¬¹ýÈ¥µÄÈËÀà±ê×¢µÄÎı¾ÕªÒªÒѾ­±» LLM Éú³ÉµÄÕªÒªËù³¬Ô½¡£

ÔÚijЩÐèÒª´ÓµÍ¡¢ÖÐ×ÊÔ´ÓïÑÔ·­Òëµ½Ó¢ÓïµÄ»úÆ÷·­ÒëÈÎÎñÖУ¬Í¨¹ýÌáʾ PaLM-540B£¬ËüÉõÖÁÄܹ»³¬Ô½Î¢µ÷Ä£ÐÍ¡£

ÔÚ BLOOM-176B ÖÐÒ²¹Û²ìµ½ÁËÀàËÆµÄÇ÷ÊÆ¡£ÕâÊÇÒòΪӢÓïÊý¾Ýͨ³£ÔÚԤѵÁ·ÓïÁÏ¿âÖÐÕ¼Á˺Ü*Àý£¬Òò´Ë LLM Éó¤ÓÚÉú³ÉÓ¢ÓïÓï¾ä¡£×¢Òâµ½£¬ÎªÁËÔÚ´úÂëÈÎÎñÖлñµÃÁ¼ºÃÐÔÄÜ£¬¾¡¹Ü Codex ºÍ PaLM ÒѾ­ÔÚÕûÌåÉϾßÓбÈ֮ǰģÐ͸üºÃµÄÐÔÄÜ£¬ÎÒÃÇÈÔÈ»ÐèÔÊÐí LLM ¶à´Î£¨k ´Î£©²ÉÑù£¬ÒÔͨ¹ý²âÊÔÑùÀý£¨Ê¹Óà pass@k ×÷Ϊ¶ÈÁ¿£©¡£

2. Ö»ÓÐÉÙÊý±ê×¢»òÕßûÓбê×¢Êý¾ÝµÄÈÎÎñ¡£ÕýÈçԭʼµÄ GPT-3 ÎÄÏ×Ëù˵£¬GPT-3 ÊÇΪÁËÄÇЩ ¡°°º¹ó±ê×¢¡± µÄÈÎÎñÉè¼ÆµÄ¡£ÔÚÕâÖÖÇé¿öÏ£¬Óü«ÉÙÁ¿±ê×¢Êý¾Ý΢µ÷Ò»¸ö¸üСµÄÄ£ÐÍͨ³£²»¿ÉÄÜ´ïµ½ GPT-3 ÔÚÁãÑù±¾£¨zero-shot£©¡¢µ¥Ñù±¾£¨ont-shot£©»òÉÙÑù±¾£¨few-shot£©µÄÇé¿öϵıíÏÖ¡£

3. ·Ö²¼Í⣨Out-of-distribution, OOD£©·º»¯¡£¸ø¶¨Ò»Ð©ÑµÁ·Êý¾Ý£¬´«Í³µÄ΢µ÷¿ÉÄÜ»á¹ýÄâºÏѵÁ·¼¯²¢ÇÒÓнϲîµÄ·Ö²¼Íâ·º»¯ÄÜÁ¦£»¶øÉÙÑù±¾µÄÉÏÏÂÎÄѧϰ£¨in-context learning£©Äܹ»ÓиüºÃµÄ·Ö²¼Íâ·º»¯ÐÔ¡£ÀýÈ磬´øÓÐÌáʾµÄ PaLM Äܹ»ÔÚ¶Ô¿¹×ÔÈ»ÓïÑÔÍÆ¶ÏÈÎÎñ£¨Adversarial Natural Language Inference£¬ANLI£©Éϳ¬Ô½¾­¹ý΢µ÷µÄ SOTA Ä£ÐÍ£¬¶øËüÔÚÕý³£µÄÓïÑÔÍÆ¶ÏÈÎÎñÉÏ¿ÉÄÜÈÔÈ»ÁÓÓÚ΢µ÷µÄ SOTA¡£

ÁíÒ»¸öÀý×ÓÊÇÌáʾ LLM ±È΢µ÷Ä£ÐÍÏÔʾ³ö¸üºÃµÄ×éºÏ·º»¯ÄÜÁ¦¡£¸üºÃµÄ·Ö²¼Íâ·º»¯ÐÔ¿ÉÄÜÊÇÒòΪÔÚÉÏÏÂÎÄѧϰÆÚ¼ä²»ÐèÒª¸üвÎÊý£¬±ÜÃâÁ˹ýÄâºÏ£»»òÕßÒòΪÄÇЩ¹ýÈ¥µÄ·Ö²¼ÍâÑùÀý¶ÔÓÚ LLM ¶øÑÔÊÇ·Ö²¼Äڵġ£ÕâÖÖʹÓó¡¾°±»²ûÊÍΪ GPT-3 µÄ³õʼÉè¼ÆÄ¿±êÖ®Ò»£º¡°Î¢µ÷Ä£ÐÍÔÚÌØ¶¨ÈÎÎñµÄÊý¾Ý¼¯ÉϵÄÐÔÄÜ¿ÉÒÔ´ïµ½ËùνµÄÈËÀàˮƽ£¬Êµ¼ÊÉÏ¿ÉÄÜ¿ä´óÁËÔÚÕæÊµÊÀ½çÖиÃÈÎÎñÉϵÄÐÔÄÜ£¬ÕâÊÇÒòΪģÐÍÖ»ÊÇѧµ½ÁËѵÁ·¼¯ÖдæÔÚµÄÐé¼ÙµÄÏà¹ØÐÔ£¬ÒÔ¼°Ä£Ð͹ý¶ÈÄâºÏÁËÕâ¸öѵÁ·¼¯ÏÁÕ­µÄ·Ö²¼¡£¡±

4. ÐèÒª´¦Àí¶àÖÖÈÎÎñµÄÄÜÁ¦£¬¶ø·Ç¹Ø×¢Ìض¨ÈÎÎñÉϵÄ׿Խ±íÏÖ¡£ÁÄÌì»úÆ÷È˾ÍÊÇÕâÑùÒ»ÖÖ³¡¾°£¬ÆäÖУ¬Óû§ÆÚ´ýËüÄܹ»ÕýÈ·µØÏìÓ¦¸÷ÖÖ¸÷ÑùµÄÈÎÎñ¡£Õâ¿ÉÄܾÍÊÇΪʲô ChatGPT ÊÇ GPT-3 ×î³É¹¦µÄʹÓó¡¾°Ö®Ò»¡£

5. ÄÇЩ¼ìË÷²»¿ÉÐеÄ֪ʶÃܼ¯ÐÍÈÎÎñ¡£´æ´¢ÔÚ LLM ÖеÄ֪ʶ¿ÉÒÔÏÔÖøµØÌá¸ßÔÚ֪ʶÃܼ¯ÐÍÈÎÎñµÄÐÔÄÜ£¬ÀýÈç±Õ¾íÎÊ´ðºÍ MMLU£¨Ò»¸ö»ù×¼Êý¾Ý¼¯£¬°üÀ¨À´×ÔÓÚ STEM¡¢ÈËÎÄ¡¢Éç¿ÆµÈ 57 ¸öѧ¿ÆµÄÑ¡ÔñÌ⣬ËüÓÃÓÚ²âÊÔ LLM µÄÊÀ½ç֪ʶºÍÎÊÌâ½â´ðµÄÄÜÁ¦£©¡£È»¶ø£¬Èç¹ûÔ¤ÏȼìË÷µÄ²½Öè¿ÉÒÔ±»¼ÓÈëÀ´×ö¼ìË÷ÔöÇ¿µÄÉú³É£¬Ò»¸ö΢µ÷µÄ¸üСµÄÄ£ÐÍ£¨ÀýÈç Atlas Ä£ÐÍ£©ÉõÖÁ¿ÉÒÔÓиüºÃµÄÐÔÄÜ£¨ÔÚ±Õ¾íµÄ NaturalQuestions ºÍ TrivialQA Êý¾Ý¼¯ÉÏ£¬Atlas ±È PaLM ºÍ×îÐ嵀 InstructGPT ¶¼Òª¸üºÃ£©¡£

¼ìË÷»òÕß´«Í³µÄËÑË÷ͬÑùÊǽ« GPT-3 »ò ChatGPT ÕûºÏµ½ËÑË÷ÒýÇæÖеÄÒ»¸ö±ØÒªµÄ²½Ö裬Õâ¿ÉÒÔÌáÉýÉú³ÉµÄ׼ȷÐÔ£¬²¢ÇÒÌṩ¸ü¶àµÄ²Î¿¼Á´½ÓÒÔÔöǿ˵·þÁ¦¡£µ«ÎÒÃÇÓ¦¸Ã³ÐÈÏ£¬ÔÚijЩÇé¿öÏ£¬¼ìË÷ÊDz»ÔÊÐí»òÕß²»ÈÝÒ׵쬱ÈÈç²Î¼Ó USMLE (ÃÀ¹úҽѧִÕÕ¿¼ÊÔ)£¬¹È¸èÒѾ­Ö¤Ã÷»ùÓÚ FLAN-PaLM µÄÄ£ÐÍ¿ÉÒÔÔÚÆäÖÐ×öµÃºÜºÃ¡£

ͬÑùµÄ£¬ÔÚ MMLU »ù×¼¼¯ÖУ¬PaLM-540B ÓÐ×Å±ÈÆäËû΢µ÷Ä£Ð͸üºÃµÄÐÔÄÜ£¬ÉõÖÁºóÕß½áºÏÁ˼ìË÷£¬¾¡¹Ü×îа汾µÄ InstructGPT »¹²îÓÚÕâЩ´øÓмìË÷µÄ΢µ÷ SOTA¡£Ò²Çë×¢Ò⣬ָÁîµ÷ÕûÒ»¸ö½ÏСµÄÄ£ÐÍÒ²¿ÉÒÔʵÏÖÓë¸ü´ó¹æÄ£µÄ LLM Ä£ÐͽӽüµÄЧ¹û£¬ÕâÒѾ­ÔÚ FLAN-T5 ÖÐÕ¹ÏÖ¡£

6.һЩÀ§ÄѵÄÈÎÎñ£¬ÆäÖÐÐèÒª LLM µÄÓ¿ÏÖÄÜÁ¦£¬±ÈÈç´øÓÐ CoT µÄÍÆÀíºÍ BIG-Bench Öеĸ´ÔÓÈÎÎñ£¨°üÀ¨Âß¼­ÍÆÀí¡¢·­Òë¡¢ÎÊ´ð¡¢ÊýѧÈÎÎñµÈ£©¡£¾Ù¸öÀý×Ó£¬PaLM ÒѾ­Õ¹Ê¾£¬ÔÚ 7 ¸ö°üÀ¨ÊýѧºÍ³£Ê¶ÍÆÀíµÄ¶à²½ÍÆÀíÈÎÎñÉÏ£¬8 - ÑùÀýµÄ CoT ±È΢µ÷ SOTA ÔÚÆäÖÐ 4 ¸öÈÎÎñÉϸüºÃ£¬ÔÚÆäËü 3 ¸öÈÎÎñÉÏÔò»ù±¾³Öƽ¡£

ÕâÑùµÄ³É¹¦±íÏÖҪͬʱ¹éÒòÓÚ¸ü´ó¹æÄ£µÄÄ£ÐÍºÍ CoT¡£PaLM »¹ÏÔʾÁËÔÚ BIG-Bench ÈÎÎñÉÏ´Ó 8B µ½ 62B ÔÙµ½ 540B Ä£Ð͵IJ»Á¬ÐøµÄ±íÏÖÌáÉý£¬Õⳬ³öÁ˹æÄ£¶¨ÂÉ£¨scailing law£©£¬±»³ÆÎª LLMs µÄÓ¿ÏÖÄÜÁ¦¡£ÁíÍ⣬´øÓÐ 5 ¸ö Prompt µÄ PaLM-540B ÔÚ Big-Bench µÄ 58 Ïî³£¼ûÈÎÎñÖÐµÄ 44 ÏîÉÏÓÅÓÚ֮ǰµÄ£¨ÉÙÑù±¾£©SOTA¡£PaLM-540B ÔÚ Big-Bench µÄ×ÜÌå±íÏÖÒ²ÓÅÓÚÈËÀàµÄƽ¾ù±íÏÖ¡£

7. һЩÐèҪģ·ÂÈËÀàµÄ³¡¾°£¬»òÕßÊÇÆäÄ¿±êÊÇÖÆ×÷ÐÔÄÜ´ïµ½ÈËÀàˮƽµÄͨÓÃÈ˹¤ÖÇÄÜ¡£Í¬ÑùµÄ£¬ChatGPT ÊÇÆäÖеÄÒ»¸ö°¸Àý£¬ChatGPT ʹ×Ô¼º¸üÏñÊÇÒ»¸öÈË£¬´Ó¶øÈ¡µÃÁËÏÖÏ󼶵ijɹ¦¡£ÕâÒ²±»²ûÊÍΪ GPT-3 µÄ³õʼÉè¼ÆÄ¿±êÖ®Ò»£º¡°ÈËÀ಻ÐèÒª´ó¹æÄ£¼à¶½Êý¾Ý¼¯À´Ñ§Ï°´ó¶àÊýÓïÑÔÈÎÎñ¡£×î¶àÖ»ÐèÒª¼¸¸öÀý×Ó£¬ÈËÀà¾Í¿ÉÒÔ½«¸÷ÖÖÈÎÎñºÍ¼¼ÇÉÎÞ·ìµØ»ìºÏÔÚÒ»Æð»òÕßÔÚËüÃÇÖ®¼äÇл»¡£Òò´Ë´«Í³µÄ΢µ÷Ä£Ð͵¼ÖÂÁËÓëÈËÀàµÄ²»¹«Æ½±È½Ï£¬¾¡¹ÜËûÃÇÉù³ÆÔÚÐí¶à»ù×¼Êý¾Ý¼¯ÖÐÓÐ×ÅÈËÀàˮƽµÄÐÔÄÜ¡£¡±

8. ÔÚһЩ´«Í³µÄ½Ó½üÓÚÓïÑÔ½¨Ä£µÄ NLP ÈÎÎñÉÏ£¬ÉÙÑù±¾ PaLM-540B Äܹ»´óÖÂÆ¥Åä»òÕßÉõÖÁ³¬¹ý΢µ÷µÄ SOTA£¬ÀýÈ磺һ¶Î»°×îºóÒ»¾äºÍ×îºóÒ»¸öµ¥´ÊµÄÍêÐÍÌî¿Õ£¬ÒÔ¼°»ØÖ¸£¨anaphora£©½âÎö¡£ÐèÒªÖ¸³ö£¬ÔÚÕâÖÖÇé¿öÏ£¬ÁãÑù±¾µÄ LLM ÒѾ­×ã¹»ÁË£¬µ¥Ñù±¾»òÉÙÑù±¾µÄʾÀýÔòͨ³£°ïÖú²»´ó¡£

ÁíһЩÈÎÎñÔò²¢²»ÐèÒªÌáʾ£¨prompt£©Ò»¸ö GPT-3 ÕâÑù¹æÄ£µÄÄ£ÐÍ£º

²»ÊʺÏʹÓÃGPT-3µÄÈÎÎñ

1. µ÷Óà OpenAI GPT-3 µÄ API ³¬³öÁËÔ¤Ë㣨ÀýÈç¶ÔÓÚûÓÐÌ«¶àÇ®µÄ´´Òµ¹«Ë¾£©¡£

2. µ÷Óà OpenAI GPT-3 µÄ API ´æÔÚ°²È«ÎÊÌ⣨ÀýÈçÊý¾Ýй¶¸ø OpenAI£¬»òÕß¿ÉÄÜÉú³ÉµÄÓк¦ÄÚÈÝ£©¡£

3. ûÓÐ×ã¹»µÄ¹¤³Ì»òÕßÓ²¼þ×ÊÔ´È¥²¿ÊðÒ»¸öÏàËÆ´óСµÄÄ£Ðͼ°Ïû³ýÍÆ¶ÏµÄÑÓ³ÙÎÊÌâ¡£ÀýÈ磬ÔÚûÓÐ×îÏȽøµÄ 80G µÄ A100 »òÕß¹¤³Ì×ÊÔ´À´ÓÅ»¯ÍƶÏËٶȵÄÇé¿öÏ£¬¼òµ¥µØÊ¹Óà Alpa ÔÚ 16 ¸ö 40G µÄ A100 Éϲ¿Êð OPT-175B ÐèÒª 10 Ãë²ÅÄÜÍê³Éµ¥¸öÑùÀýµÄÍÆ¶Ï£¬Õâ¶ÔÓÚ´ó¶àÊýÏÖʵÊÀ½çµÄÔÚÏßÓ¦ÓóÌÐòÀ´ËµÊÇÎÞ·¨½ÓÊܵÄÑÓ³Ù¡£

4. Èç¹ûÏëÓà GPT-3 Ìæ´úÒ»¸öÐÔÄÜÁ¼ºÃµÄ¡¢¸ß׼ȷ¶ÈµÄ΢µ÷Ä£ÐÍ£¬»òÕßÏëÒªÔÚÒ»Ð©ÌØ¶¨µÄµ¥Ò»ÈÎÎñºÍʹÓó¡¾°ÏÂÈ¥²¿ÊðÒ»¸ö NLU£¨Natural Language Understanding£¬×ÔÈ»ÓïÑÔÀí½â£©»ò NLG£¨Natural Language Generating£¬×ÔÈ»ÓïÑÔÉú³É£©Ä£ÐÍ£¬ÇëÈý˼ÕâÊÇ·ñÖµµÃ¡£

¶ÔÓÚһЩ´«Í³µÄ NLU ÈÎÎñ£¬±ÈÈç·ÖÀàÈÎÎñ£¬ÎÒ½¨ÒéÊ×Ïȳ¢ÊÔ΢µ÷ FLAN-T5-11B Ä£ÐÍ£¬¶ø²»ÊÇÌáʾ GPT-3¡£ÀýÈ磬ÔÚ SuperGLUE£¬Ò»¸öÀ§ÄÑµÄ NLU »ù×¼Êý¾Ý¼¯£¨°üÀ¨ÔĶÁÀí½â¡¢Îı¾Ô̺¬¡¢´ÊÒåÏûÆç¡¢¹²Ö¸Ïû½âºÍÒò¹ûÍÆÀíµÈÈÎÎñ£©ÉÏ£¬ËùÓÐµÄ PaLM-540B µÄÉÙÑù±¾ÌáʾÐÔÄܶ¼ÁÓÓÚ΢µ÷µÄ T5-11B£¬²¢ÔÚÆäÖдó¶àÊýÈÎÎñÉÏÓÐ×ÅÏÔÖøµÄ²î¾à¡£Èç¹ûʹÓÃԭʼ GPT3£¬ÆäÌáʾ½á¹ûÓë΢µ÷ SOTA µÄ½á¹ûÖ®¼äµÄ²î¾à¸ü´ó¡£ÓÐȤµÄÊÇ£¬¼´Ê¹ÊǾ­¹ý΢µ÷µÄ PaLM Ò²½ö±È¾­¹ý΢µ÷µÄ T5-11B ÓÐ×ÅÓÐÏ޵ĸĽø£¬¶ø¾­¹ý΢µ÷µÄ PaLM ÉõÖÁ±È¾­¹ý΢µ÷µÄ±à - *Ä£ÐÍ 32B MoE Ä£ÐÍ»¹Òª²î¡£Õâ±íÃ÷ʹÓøüºÏÊʵļܹ¹£¨ÀýÈç±à - *Ä£ÐÍ£©Î¢µ÷½ÏСµÄÄ£ÐÍÈÔÈ»ÊDZÈʹÓ÷dz£´óµÄ½ö*Ä£Ð͸üºÃµÄ½â¾ö·½°¸£¬ÎÞÂÛÊÇ΢µ÷»¹ÊÇÌáʾÀ´Ê¹ÓÃÕâЩ´óÄ£ÐÍ¡£¸ù¾Ý×î½üµÄһƪÂÛÎÄ£¬¼´Ê¹¶ÔÓÚ×ͳµÄ NLU ·ÖÀàÈÎÎñ ¡ª¡ª Çé¸Ð·ÖÎö£¬ChatGPT ÈÔÈ»±È¾­¹ý΢µ÷µÄ½ÏСģÐͲ

һЩ²»ÒÔÏÖʵÊÀ½çÊý¾ÝΪ»ù´¡µÄÀ§ÄÑÈÎÎñ¡£ÀýÈ磬BigBench ÖÐÈÔÈ»ÓÐÐí¶à¶Ô LLM À´ËµÀ§ÄѵÄÈÎÎñ¡£¾ßÌåµØËµ£¬ÔÚ 35% µÄ BigBench ÈÎÎñÉÏ£¬ÈËÀàµÄƽ¾ù±íÏÖÈÔÈ»¸ßÓÚ PaLM-540B£¬²¢ÇÒÔÚijЩÈÎÎñÖУ¬À©´óÄ£Ð͹æÄ£ÉõÖÁÎÞ¼ÃÓÚÊ£¬ÀýÈçµ¼º½ºÍÊýѧ¹éÄÉ¡£ÔÚÊýѧ¹éÄÉÖУ¬µ±ÌáʾÖеļÙÉè²»Õýȷʱ£¨ÀýÈç ¡°2 ÊÇÆæÊý¡±£©£¬PaLM »á·¸ºÜ¶à´íÎó¡£ÔÚÄæ¹æÄ£¶¨ÂɾºÈü (Inverse Scaling Law Challenge) ÖУ¬Ò²¹Û²ìµ½ÁËÀàËÆµÄÇ÷ÊÆ£¬ÀýÈçÖØÐ¶¨ÒåÊýѧ·ûºÅ£¨ÀýÈçÌáʾ¿ÉÄÜ ¡°½« ¦Ð ÖØÐ¶¨ÒåΪ 462¡±£©ºóÔÙʹÓÃÕâ¸ö·ûºÅ¡£ÔÚÕâÖÖÇé¿öÏ£¬LLM ÖеÄÏÖʵÊÀ½çÏÈÑé֪ʶ̫ǿ¶øÎÞ·¨±»Ìáʾ¸²¸Ç£¬¶øÎ¢µ÷½ÏСµÄÄ£ÐÍ¿ÉÄÜ¿ÉÒÔ¸üºÃµØÑ§Ï°ÕâЩ·´ÊÂʵ֪ʶ¡£

ÔںܶàÓïÑÔÈÎÎñºÍ»úÆ÷·­ÒëÈÎÎñÖУ¬Ê¹ÓÃÉÙÑù±¾µÄÌáʾ GPT ÈÔȻҪ±È΢µ÷µÄ¸üСµÄÄ£Ð͸ü²î¡£ÕâºÜ¿ÉÄÜÊÇÓÉÓÚ³ýÓ¢ÓïÖ®ÍâµÄÆäËüÓïÑÔÔÚԤѵÁ·ÓïÁÏ¿âÖÐÕ¼±ÈºÜÉÙ¡£

µ±´ÓÓ¢Óï·­ÒëΪÆäËûÓïÑÔ£¬ÒÔ¼°·­Òë¸ß×ÊÔ´ÓïÑÔµ½Ó¢Óïʱ£¬PaLM ºÍ ChatGPT ÈÔÈ»±ÈÔÚ»úÆ÷·­ÒëÈÎÎñÉÏ΢µ÷µÄ¸üСµÄÄ£ÐÍÒª²î¡£

¶ÔÓÚ¶àÓïÑÔÎÊ´ðÈÎÎñÀ´Ëµ£¬ÔÚÉÙÑù±¾µÄ PaLM-540B ºÍ΢µ÷µÄ¸üСģÐÍÖ®¼ä»¹´æÔڽϴó²î¾à¡£

¶ÔÓÚ¶àÓïÑÔÎı¾Éú³É£¨°üÀ¨Îı¾ÕªÒªºÍÊý¾Ýµ½Îı¾Éú³É£©£¬ÔÚÉÙÑù±¾µÄ PaLM-540B ºÍ΢µ÷µÄ¸üСģÐÍÖ®¼ä»¹´æÔڽϴó²î¾à¡£Ôڴ󲿷ÖÈÎÎñÉϼ´Ê¹Î¢µ÷µÄ PaLM-540B Ò²½ö½ö±È΢µ÷µÄ T5-11B ÓÐÓÐÏÞµÄÌáÉý£¬²¢ÈÔÈ»ÁÓÓÚ΢µ÷µÄ SOTA¡£

¶ÔÓÚ³£Ê¶ÍÆÀíÈÎÎñ£¬ÔÚ×îºÃµÄÉÙÑù±¾Ìáʾ LLM ºÍ΢µ÷µÄ SOTA Ö®¼äÈÔÈ»´æÔÚ׎ϴóµÄ²î¾à£¬ÀýÈ磺OpenbookQA£¬ARC£¨°üÀ¨ Easy ºÍ Challenge °æ±¾£©ÒÔ¼° CommonsenseQA£¨ÉõÖÁʹÓÃÁË CoT Ìáʾ£©¡£

¶ÔÓÚ»úÆ÷ÔĶÁÀí½âÈÎÎñ£¬ÔÚ×îºÃµÄÉÙÑù±¾Ìáʾ LLM ºÍ΢µ÷µÄ SOTA Ö®¼äÈÔÈ»´æÔÚ׎ϴóµÄ²î¾à¡£ÔÚ´ó¶àÊýÊý¾Ý¼¯ÉÏ£¬Õâ¸ö²î¾à¿ÉÄܷdz£¾Þ´ó¡£Õâ¿ÉÄÜÊÇÒòΪËùÓлشðÎÊÌâËùÐèµÄ֪ʶ¶¼ÒѾ­°üº¬ÔÚ¸ø³öµÄÎı¾ÖУ¬²¢²»ÐèÒª LLM ÖеĶîÍâ֪ʶ¡£

×ܽáһϣ¬ÉÏÃæµÄÕâЩÈÎÎñ¿ÉÒÔ±»¹éΪÒÔÏÂÀà±ðÖ®Ò»£º

1.һЩ NLU ÈÎÎñ£¬¼È²»ÐèÒª¶îÍâµÄ֪ʶҲ²»ÐèÒª LLM µÄÉú³ÉÄÜÁ¦¡£ÕâÒâζ×ŲâÊÔÊý¾Ý´ó¶àÊý¶¼ºÍÊÖÍ·µÄѵÁ·Êý¾ÝÔÚͬһ¸ö·Ö²¼Ö®ÖС£ÔÚÕâЩÈÎÎñÉÏ£¬¹ýȥ΢µ÷µÄ½ÏСģÐÍÒѾ­±íÏֺܺÃÁË¡£

2.һЩ²»ÐèÒª¶îÍâµÄÀ´×Ô LLM ÖÐ֪ʶµÄÈÎÎñ£¬ÒòΪÿһ¸öÀý×ÓÒѾ­ÔÚÉÏÏÂÎÄ»òÕßÌáʾÖаüº¬ÁË×ã¹»µÄ֪ʶ£¬ÀýÈç»úÆ÷ÔĶÁÀí½â¡£

3.һЩÐèÒª¶îÍâ֪ʶ£¬µ«²»Ì«¿ÉÄÜ´Ó LLM ÖлñµÃÕâÑùµÄ֪ʶ£¬»òÕß LLM ²»Ì«¿ÉÄܼû¹ýÀàËÆ·Ö²¼µÄÈÎÎñ£¬ÀýÈçһЩµÍ×ÊÔ´ÓïÑÔÖеÄÈÎÎñ£¬LLM ÔÚÕâЩÓïÑÔÖÐÖ»ÓÐÓÐÏÞµÄԤѵÁ·Ñù±¾¡£

4.һЩÈÎÎñ£¬ÐèÒªÓë LLM Öаüº¬µÄ֪ʶËù²»Ò»ÖµÄ֪ʶ£¬»òÕß²¢·Ç»ùÓÚÏÖʵÊÀ½çµÄÓïÑÔÊý¾ÝµÄ֪ʶ¡£ÒòΪ LLM ÊÇÔÚÏÖʵÊÀ½çµÄÓïÑÔÊý¾ÝÉÏѵÁ·µÄ£¬ËüÄÑÒÔÔÚеÄÈÎÎñÖÐÀûÓ÷´ÊÂʵ֪ʶ¸²¸ÇÔ­ÓÐ֪ʶ¡£³ýÁËÔÚÄæ¹æÄ£¶¨ÂÉÌôÕ½ÖÐµÄ ¡°ÖØÐ¶¨ÒåÊýѧ·ûºÅ¡± ÎÊÌâÖ®Í⣬»¹ÓÐÁíÒ»¸öÈÎÎñ£¬¼´¸´ÊöÓÐϸ΢¸Ä¶¯µÄÃûÑÔ£¬ÆäÖÐ LLM ±»ÒªÇó¸´ÊöÒ»¸öÔÚ prompt ÖгöÏֵı»Ð޸ĵÄÃûÑÔ¡£ÔÚÕâÖÖÇé¿öÏ£¬LLM ÇãÏòÓÚÖØ¸´³öÃûÑÔµÄԭʼ°æ±¾£¬¶ø·ÇÐ޸ĹýºóµÄ°æ±¾¡£

5.һЩÈÎÎñÐèÒªÀ´×Ô LM µÄ֪ʶ£¬µ«Ò²ÑÏÖØÒÀÀµÓÚ²Ù×ÝÕâЩ֪ʶ£¬¶ø LLM µÄ ¡°Ô¤²âÏÂÒ»¸ö token¡± µÄÄ¿±êÎÞ·¨ÇáÒ×ʵÏÖÕâÖÖ²Ù×Ý¡£Ò»¸öÀý×ÓÊÇһЩ³£Ê¶ÍÆÀíÈÎÎñ¡£CoT ºÍ least-to-most Ìáʾ¿ÉÒÔ°ïÖú LLM ÍÆÀíµÄÔ­Òò¿ÉÄÜÊÇËûÃÇ¿ÉÒÔ¸üºÃµØµ÷³öÄÇЩÁ¬ÐøµÄԤѵÁ·Îı¾£¬ÕâЩÁ¬ÐøÎı¾Ç¡ºÃÄ£·ÂÁ˹滮ºÍ·Ö½â / ×éºÏ֪ʶµÄ¹ý³Ì¡£

Òò´Ë£¬CoT ºÍ least-to-most ÌáʾÔÚһЩÊýÑ§ÍÆÀí¡¢´úÂëºÍÆäËû¼òµ¥µÄ×ÔÈ»ÓïÑÔÍÆÀíÈÎÎñÖбíÏÖÁ¼ºÃ£¬µ«ÔÚÐí¶à³£Ê¶ÍÆÀí£¨ÀýÈçÔÚÄæ¹æÄ£¶¨ÂɾºÈüÖÐչʾµÄÑÝÒïÍÆÀíÈÎÎñ£©ºÍ×Ô¶¨Òå·ûºÅÍÆÀíÈÎÎñÖÐÈÔÈ»±íÏÖ²»¼Ñ¡£ÕâЩÈÎÎñͨ³£²»±»×ÔÈ»ÓïÑÔÊý¾ÝÖеĴó¶àÊýÕæÊµÊÀ½çµÄÁ¬ÐøÐòÁÐËù°üº¬£¬¶øÐèÒª²Ù×Ý·ÖÉ¢ÔÚ¸÷´¦µÄ֪ʶÀ´Íê³É¡£

6.һЩÈÝÒ×Êܵ½ÉÏÏÂÎÄѧϰÑùÀý»òÕßÕæÊµÊÀ½çÊý¾ÝÖдæÔÚµÄÐé¼ÙÏà¹ØÐÔÓ°ÏìµÄÈÎÎñ¡£Ò»¸öÀý×ÓÊÇÀ´×ÔÓÚÄæ¹æÄ£¶¨ÂɾºÈüÖеÄÉæ¼°·ñ¶¨´ÊµÄÎÊ´ð¡£Èç¹ûÒ»¸ö LLM ±»ÌáÎÊ£º¡°Èç¹ûһֻèµÄÌåεÍÓÚÆ½¾ùˮƽ£¬Ëü¾Í²»ÔÚ¡­¡­¡±£¬ËüÇãÏòÓڻش𠡰ΣÏÕÖ®ÖС± ¶ø·Ç ¡°°²È«·¶Î§ ¡°¡£ÕâÊÇÒòΪ LLM Êܵ½³£¼ûµÄ ¡°µÍÓÚÆ½¾ùÌåΡ± ºÍ ¡°Î£ÏÕ¡± Ö®¼äµÄ¹ØÏµËùÖ§Å䣬¶øÔÚ·ñ¶¨µÄÇé¿öÏ£¬ÕâÊÇÒ»ÖÖÐé¼ÙµÄÏà¹ØÐÔ¡£

7.һЩĿ±êÓë´¦ÀíÓïÑÔÊý¾ÝÏÔÖø²»Í¬µÄÈÎÎñ£¬ÀýÈ磺»Ø¹éÎÊÌ⣬ÆäÖÐ΢µ÷Ä£ÐͺÜÄѱ» LLM È¡´ú¡£ÖÁÓÚ¶àģ̬ÈÎÎñ£¬ËüÃDz»Äܱ» LLM ½â¾ö£¬µ«ÊÇ¿ÉÄÜÄÜ´Ó´ó¹æÄ£µÄԤѵÁ·¶àģ̬ģÐÍÖÐÊÜÒæ¡£

8.һЩÈÎÎñ²»ÐèÒª LLM µÄÓ¿ÏÖÄÜÁ¦¡£ÎªÁË׼ȷµØ¶Ô¸ü¶à´ËÀàÈÎÎñ½øÐмø±ð£¬ÎÒÃÇÐèÒª¸üºÃµØÁ˽â LLM ѵÁ·ÆÚ¼ä£¬Ó¿ÏÖÄÜÁ¦ÊǴӺβúÉúµÄ¡£

×¢Òâµ½£¬ÔÚÏÖʵÊÀ½çµÄʹÓó¡¾°ÖУ¬¼´Ê¹ÓÉÓÚÎÞ·¨Âú×ãÑÓ³ÙÒªÇóÒò¶øÎÞ·¨ÔÚÏßµØÊ¹Óà LLM£¬ÈÔÈ»¿ÉÒÔʹÓà LLM ÀëÏßÉú³É»ò±ê×¢Êý¾Ý¡£´ËÀà×Ô¶¯±ê×¢µÄ±êÇ©¿ÉÒÔÔÚÏß²éÕÒ²¢Ìṩ¸øÓû§£¬»òÓÃÓÚ΢µ÷½ÏСµÄÄ£ÐÍ¡£Ê¹ÓôËÀàÊý¾Ý΢µ÷½ÏСµÄÄ£ÐÍ¿ÉÒÔ¼õÉÙѵÁ·Ä£ÐÍËùÐèµÄÈ˹¤×¢ÊÍÊý¾Ý£¬²¢½« LLM µÄһЩÐÂÐËÄÜÁ¦£¨ÀýÈç CoT£©×¢Èë½ÏСµÄÄ£ÐÍ¡£

×ÜÖ®£¬µ±ÓÐ×ã¹»µÄ±ê¼ÇÊý¾Ýʱ£¬¿¼Âǵ½¿ªÔ´ FLAN-T5 ÔÚÐí¶àÈÎÎñÖеľªÈËÐÔÄÜ£¬ÎÒÍÆ¼öÄÇЩµ÷Óà OpenAI API µÄ×ÊÔ´ÓÐÏ޵ĸöÌ壬Ӧ¸ÃÊ×Ïȳ¢ÊÔÔÚÄ¿±êÈÎÎñÉÏ΢µ÷ FLAN-T5-11B¡£´ËÍ⣬¸ù¾Ý×î½üÔÚ MMLU Êý¾Ý¼¯ÉÏ£¬FLAN-PaLM-540B Óë×îа汾µÄ InstructGPT µÄÐÔÄÜ£¨¸ù¾Ý HELM£©Ïà±ÈºÃµÃ¾ªÈ˵ÄÐÔÄÜ£¬¹È¸è¿ÉÄÜÓµÓÐ±È OpenAI ¸üÇ¿´óµÄ»ù´¡Ä£ÐÍ£¬Èç¹û OpenAI ÒѾ­Í¨¹ý API ·¢²¼ÁËËûÃÇ»ñµÃµÄ×îÇ¿µÄ LLM¡£

¹È¸èΨһʣϵIJ½ÖèÊÇͨ¹ýÈËÀà·´À¡Ê¹Õâ¸ö LLM Óë¶Ô»°³¡¾°¶ÔÆë£¨alignment£©¡£Èç¹ûËûÃǺܿ췢²¼ÀàËÆ ChatGPT µÄ»òÕ߸üºÃµÄÁÄÌì»úÆ÷ÈË£¬ÎÒ²»»á¸Ðµ½¾ªÑÈ ¡ª¡ª ¾¡¹ÜËûÃÇ×î½ü ¡°Ê§°Ü¡± µØÕ¹Ê¾ÁËÒ»°æ¿ÉÄÜ»ùÓÚ LaMDA µÄ Bard¡£

Ó¢ÎÄÔ­°æ×÷ÕߣºÑ·æ£¬ÏÖÈÎÑÇÂíÑ·¿ÆÑ§¼Ò£¬±¾¿Æ±ÏÒµÓÚ±±´ó£¬Ë¶Ê¿±ÏÒµÓÚ×ôÖÎÑÇÀí¹¤Ñ§Ôº£¬Ê¦´Ó Stanford ÑîµÑÒ»½ÌÊÚ¡£


个人签名
¹ÉƱºÏ×÷
ÎÒÃÇÓжÀÌØµÄÏûÏ¢ÍøÂçºÍÇþµÀ,¼ÓÉÏ˽ļ×ʽðÀïµÄʵս²ÙÅ̸ßÊÖ£¬×¨ÒµÎªÄú²¶×½»ñÀûÁ¼»ú£¬±£Ö¤ÄúµÄ¸ßÊÕÒæ¡£ÎÒÃÇ»áÔÚ½»Ò×ʱ¼ä׼ȷµÄ¸æËßÄúÐèÒªÂòÈëµÄ¹ÉƱ\ÂòÈë¼Û¸ñ\ÂòÈëÊýÁ¿,׼ȷµÄ¸æËßÄúÂô³öµÄʱ¼äºÍ¼Û¸ñ,ÇÒÕâ¸ö¼ÛλÔÚÎÒÃÇÍÆ¼öµÄʱ¼äÄÚÒ»¶¨»á³öÏÖ,ÎÒÃǵÄÐÅÏ¢ÊǾßÓо«×¼µÄʵս²Ù×÷¼ÛÖµµÄÐÅÏ¢!£¬°ïÄú×î´ó³Ì¶ÈµØ°ÑÎÕ»ñÀûÁ¼»ú£¬½Úʡʱ¼äºÍ¾«Á¦! ÎÒÃǽ«Æ¾ÎÒÃǵijÏÐÅ¡¢×¨Òµ¡¢¸ßЧ¡¢ÎñʵµÄ·þÎñΪÄú´´Ôì²Æ¸»Óë¿ìÀÖ! ÏÈÓ®Àû,ºó¸¶·Ñ,Õâ¾ÍÊÇÎÒÃǵÄʵÁ¦ ÎÒÃÇΪÄú·þÎñ,Ìṩһ°ãÈýµ½Îå¸ö½»Ò×ÈÕÕÇ·ùÔÚ10%×óÓҵĶÌÏ߹ɯ±,±£Ö¤¹ÉƱÂòµÃµ½,ÂôµÃ³ö!ÈÃÄãÊÕÒæÔÚÏÈ£¬×¬Ç®ÔÚÏÈ! ¸¶²»¸¶,ÓÉÄ㶨,ÊDz»ÊǸßÊÖ,׬Ǯ˵ÁËËã!!! ÎÒÃÇÕýÔÚѰÕÒ¹ÉÆ±ºÏ×÷»ï°é: 1 ×Ê½ð¼°¹ÉÆ±ÕʺÅÓÉÄã×Ô¼ºÕÆ¿Ø 2 ±¾´¦¸ºÔð֪ͨÄã¹ÉƱ½ø³öµÄÊýÁ¿Ê±»úºÍ¼Û¸ñ 3 ²»ÓÃÏȸ¶·ÑÓ㬵ÈÄãÓ¯ÀûºóÔÙ½áËã,3/7·Ö³É 4 ÄãÊÇÉϰàµÄ¿ÉÒԵ绰¼°Ê±Í¨ÖªÄãÂòÈëºÍÂô³ö ÈÃÄãÏÈÓ¯Àû£¬È»ºóÊÕ·Ñ£¬Õâ¾ÍÊÇÎÒÃǵÄʵÁ¦!



ÏÂÃæÊÇÎâÀÏʦ¹ÉƱͶ×Ê×ÉѯºÏ×÷µÄQ Q ÁªÏµ·½Ê½£º   Q Q :2080053532    Q Q :2654704327     Q Q: 3532015225  ÓÐÐèÒªµÄÅóÓÑ¿ÉÒÔÁªÏµÎâÀÏʦgphztz.com
IP ÊôµØ£ºÉÜÐË
Ïà¹ØÌû×Ó
ÊÕ²Ø ¶¥ 0 ²È 0
0
¹²1Ò³Ê×Ò³ÉÏÒ»Ò³1ÏÂһҳβҳ

Copyright @ 2018 . All rights reserved.

Õã¹«Íø°²±¸33068102001146ºÅ

  • 电话直呼

    • 15050108135
    • ÎâÀÏʦ £º
    • ÎâÀÏʦ £º
    • ÎâÀÏʦ £º
    • ÎâÀÏʦ £º
技术支持£º CLOUD | 管理登录
¡Á
seo seo

ÏûÏ¢ÄÚÈÝ

¡Á
ÏûÏ¢³¤¶È×î¶à¿ÉÌí¼Ó100¸öºº×Ö»òÕß200¸ö×Öĸ

»Ø¸´ÄÚÈÝ

¡Á

±à¼­»Ø¸´ÄÚÈÝ

¡Á