|
LeCun¿ñÔÞ£º600µ¶GPT-3.5Æ½Ìæ£¡ ˹̹¸£70ÒÚ²ÎÊý¡¸ÑòÍÕ¡¹±¬»ð£¬LLaMAɱ·èÁË时间£º2023-03-15 MetaµÄLLaMAÄ£ÐÍ¿ªÔ´£¬ÈÃÎı¾´óÄ£ÐÍÓÀ´ÁËStable Diffustionʱ¿Ì¡£½ñÌ죬˹̹¸£·¢²¼ÁËÒ»¸öÓÉLLaMA 7B΢µ÷µÄÄ£ÐÍAlpaca£¬ÑµÁ·3Сʱ£¬ÐÔÄܱȼçGPT-3.5¡£ Ò»¾õÐÑÀ´£¬Ë¹Ì¹¸£´óÄ£ÐÍAlpaca£¨²ÝÄàÂí£©»ðÁË¡£
û´í£¬AlpacaÊÇÓÉMetaµÄLLaMA 7B΢µ÷¶øÀ´µÄÈ«ÐÂÄ£ÐÍ£¬½öÓÃÁË52kÊý¾Ý£¬ÐÔÄÜÔ¼µÈÓÚGPT-3.5¡£ ¹Ø¼üÊÇѵÁ·³É±¾ÆæµÍ£¬²»µ½600ÃÀÔª¡£¾ßÌ廨·ÑÈçÏ£º ÔÚ8¸ö80GB A100ÉÏѵÁ·ÁË3¸öСʱ£¬²»µ½100ÃÀÔª£» Éú³ÉÊý¾ÝʹÓÃOpenAIµÄAPI£¬500ÃÀÔª¡£
˹̹¸£´óѧ¼ÆËã»ú¿ÆÑ§¸±½ÌÊÚPercy Liang³Æ£¬ ÓÉÓÚȱ·¦Í¸Ã÷¶È/ÎÞ·¨ÍêÈ«·ÃÎÊÏñGPT 3.5ÕâÑùµÄÓÐÄÜÁ¦µÄÖ¸ÁîÄ£ÐÍ£¬½ø¶øÏÞÖÆÁËÕâÒ»ÖØÒªÁìÓòµÄѧÊõÑо¿¡£ÎÒÃÇÔÚ Alpaca £¨LLaMA 7B + text-davinci-003£©ÉÏÂõ³öÁËһС²½¡£
¿´µ½ÓÖÓÐÈËÔÚ×Ô¼Ò´óÄ£ÐÍÉÏÈ¡µÃÁËеijɹû£¬Yann LeCun·è¿ñת·¢£¨Ðû´«Òªµ½Î»£©¡£
3Сʱ΢µ÷70ÒÚ²ÎÊý£¬600ÃÀÔª¸ã¶¨ »°²»¶à˵£¬ÏÈÊÔÓÃÒ»²¨¡£ ÎÊ£º¸æËßÎÒһЩ¹ØÓÚÑòÍÕµÄÊÂÇé¡£ ´ð£ºÑòÍÕÊÇÀ´×ÔÄÏÃÀÖÞµÄÂæÍÕÆ·ÖÖ£¬ÓëÃÀÖÞÍÕºÍÂæÍÕÓйء£ËüÃÇͨ³£ÒòÆäÏËά¶ø±»ËÇÑø£¬ÓÃÓÚÖÆÔìÉÝ³ÞÆ·£¬ÈçëÒºÍë̺¡£ÓÉÓÚÑòÍÕµÄÎÂÈáºÍÓѺõÄÌìÐÔ£¬ËüÃÇÒ²ÊǺÜÊÜ»¶ÓµÄ³èÎï¡£
ÌåÑéÁ´½Ó£ºhttps://crfm.stanford.edu/alpaca/
¶ÔÓÚ˹̹¸£µÄÍŶÓÀ´Ëµ£¬ÏëÒªÔÚÔ¤ËãÄÚѵÁ·Ò»¸ö¸ßÖÊÁ¿µÄÖ¸Áî×ñÑÄ£ÐÍ£¬¾Í±ØÐëÃæÁÙ2¸öÖØÒªµÄÌôÕ½£ºÒªÓÐÒ»¸öÇ¿´óµÄԤѵÁ·ÓïÑÔÄ£ÐÍ£¬ÒÔ¼°Ò»¸ö¸ßÖÊÁ¿µÄÖ¸Áî×ñÑÊý¾Ý¡£ ǡǡ£¬Ìṩ¸øÑ§ÊõÑо¿ÈËԱʹÓõÄLLaMAÄ£Ð͸㶨Á˵ÚÒ»¸öÎÊÌâ¡£ ¶ÔÓÚµÚ¶þ¸öÌôÕ½£¬¡¸Self-Instruct: Aligning Language Model with Self Generated Instructions¡¹ÂÛÎĸøÁËºÜºÃµÄÆô·¢£¬¼´Ê¹ÓÃÏÖÓеÄÇ¿ÓïÑÔÄ£ÐÍÀ´×Ô¶¯Éú³ÉÖ¸ÁîÊý¾Ý¡£ È»¶ø£¬LLaMAÄ£ÐÍ×î´óµÄÈõµãÊÇȱ·¦Ö¸Áî΢µ÷¡£OpenAI×î´óµÄ´´ÐÂÖ®Ò»¾ÍÊǽ«Ö¸Áîµ÷ÓÅÓÃÔÚÁËGPT-3ÉÏ¡£ ¶Ô´Ë£¬Ë¹Ì¹¸£Ê¹ÓÃÁËÏÖÓеĴóÓïÑÔÄ£ÐÍ£¬À´×Ô¶¯Éú³É×ñÑÖ¸ÁîÑÝʾ¡£
Ê×ÏÈ´Ó×ÔÉú³ÉÖ¸ÁîÖÖ×Ó¼¯ÖеÄ175¸öÈ˹¤±àдµÄ¡¸Ö¸Áî-Êä³ö¡¹¶Ô¿ªÊ¼£¬È»ºó£¬Ìáʾtext-davinci-003ʹÓÃÖÖ×Ó¼¯×÷ΪÉÏÏÂÎÄʾÀýÀ´Éú³É¸ü¶àÖ¸Áî¡£ ͨ¹ý¼ò»¯Éú³É¹ÜµÀ¸Ä½øÁË×ÔÉú³ÉÖ¸ÁîµÄ·½·¨£¬ÕâÑù´ó´ó½µµÍÁ˳ɱ¾¡£ÔÚÊý¾ÝÉú³É¹ý³ÌÖУ¬²úÉúÁË52K¸ö¶ÀÌØÖ¸ÁîºÍÏàÓ¦µÄÊä³ö£¬Ê¹ÓÃOpenAI APIµÄ³É±¾²»µ½500ÃÀÔª¡£ ÓÐÁËÕâ¸öÖ¸Áî×ñѵÄÊý¾Ý¼¯£¬Ñо¿ÈËÔ±ÀûÓÃHugging FaceµÄѵÁ·¿ò¼Ü¶ÔLLaMAÄ£ÐͽøÐÐ΢µ÷£¬ÀûÓÃÁËÍêÈ«·ÖƬÊý¾Ý²¢ÐУ¨FSDP£©ºÍ»ìºÏ¾«¶ÈѵÁ·µÈ¼¼Êõ¡£
ÁíÍ⣬΢µ÷Ò»¸ö7BµÄLLaMAÄ£ÐÍÔÚ8¸ö80GBµÄA100ÉÏ»¨ÁË3¸ö¶àСʱ£¬ÔÚ´ó¶àÊýÔÆ¼ÆË㹩ӦÉÌÄÇÀïµÄ³É±¾²»µ½100ÃÀÔª¡£ Ô¼µÈÓÚGPT-3.5 ΪÁËÆÀ¹ÀAlpaca£¬Ë¹Ì¹¸£Ñо¿ÈËÔ±¶Ô×ÔÉú³ÉÖ¸ÁîÆÀ¼Û¼¯µÄÊäÈë½øÐÐÁËÈ˹¤ÆÀ¹À£¨ÓÉ5λѧÉú×÷Õß½øÐУ©¡£ Õâ¸öÆÀ¼Û¼¯ÊÇÓÉ×ÔÉú³ÉÖ¸Áî×÷ÕßÊÕ¼¯µÄ£¬º¸ÇÁ˶àÑù»¯µÄÃæÏòÓû§µÄÖ¸Á°üÀ¨µç×ÓÓʼþд×÷¡¢É罻ýÌåºÍÉú²úÁ¦¹¤¾ßµÈ¡£ ËûÃǶÔGPT-3.5£¨text-davinci-003£©ºÍAlpaca 7B½øÐÐÁ˱Ƚϣ¬·¢ÏÖÕâÁ½¸öÄ£Ð͵ÄÐÔÄܷdz£ÏàËÆ¡£AlpacaÔÚÓëGPT-3.5µÄ±È½ÏÖУ¬»ñʤ´ÎÊýΪ90¶Ô89¡£ ¼øÓÚÄ£Ð͹æÄ£½ÏС£¬ÇÒÖ¸ÁîÊý¾ÝÁ¿²»´ó£¬È¡µÃÕâ¸ö½á¹ûÒѾÊÇÏ൱¾ªÈËÁË¡£ ³ýÁËÀûÓÃÕâ¸ö¾²Ì¬ÆÀ¹À¼¯£¬ËûÃÇ»¹¶ÔAlpacaÄ£ÐͽøÐÐÁ˽»»¥Ê½²âÊÔ£¬·¢ÏÖAlpacaÔÚ¸÷ÖÖÊäÈëÉϵıíÏÖÍùÍùÓëGPT-3.5ÏàËÆ¡£ ˹̹¸£ÓÃAlpaca½øÐеÄÑÝʾ£º ÑÝʾһÈÃAlpacaÀ´Ì¸Ì¸×Ô¼ººÍLLaMAµÄÇø±ð¡£
ÑÝʾ¶þÈÃAlpacaдÁËÒ»·âÓʼþ£¬ÄÚÈݼò½àÃ÷ÁË£¬¸ñʽҲºÜ±ê×¼¡£
ÉÏÊöÀý×Ó¿ÉÒÔ¿´³ö£¬AlpacaµÄÊä³ö½á¹ûÒ»°ã¶¼Ð´µÃ²»´í£¬¶øÇÒ´ð°¸Í¨³£±ÈChatGPT¼ò¶Ì£¬ÌåÏÖÁËGPT-3.5½Ï¶ÌÊä³öµÄ·ç¸ñ¡£ µ±È»ÁË£¬Alpaca±íÏÖ³öÓïÑÔÄ£Ðͳ£¼ûµÄȱÏÝ¡£ ±ÈÈ磬½«Ì¹É£ÄáÑǵÄÊ×¶¼Ëµ³ÉÁË´ïÀÛË¹ÈøÀÄ·¡£ÊµÔò£¬1974ÄêÖ®ºó£¬¶à¶àÂíÊÇ̹ɣÄáÑǵÄÐÂÊ×¶¼ÁË£¬´ïÀÛË¹ÈøÀÄ·Ö»ÊÇ̹ɣÄáÑÇ×î´óµÄ³ÇÊС£
׫дÖÜÏêµÄÂÛÎÄժҪʱ£¬Alpaca´«²¥ÁË´íÎóµÄÐÅÏ¢¡£
ÁíÍ⣬Alpaca¿ÉÄÜ»¹´æÔÚÐí¶àÓëµ×²ãÓïÑÔÄ£ÐͺÍÖ¸Áî΢µ÷Êý¾ÝÏà¹ØµÄ¾ÖÏÞ¡£È»¶ø£¬AlpacaΪÎÒÃÇÌṩÁËÒ»¸öÏà¶ÔÇáÁ¿¼¶µÄÄ£ÐÍ£¬Ëü¿ÉÒÔ³ÉΪδÀ´Ñо¿´óÄ£ÐÍÖØÒªÈ±ÏݵĻù´¡¡£ Ŀǰ£¬Ë¹Ì¹¸£½ö¹«²¼ÁËAlpacaµÄѵÁ··½·¨ºÍÊý¾Ý£¬²¢´òËãÔÚδÀ´·¢²¼Ä£Ð͵ÄÈ¨ÖØ¡£ µ«ÊÇ£¬AlpacaÊDz»ÄÜÓÃÓÚÉÌÒµÓÃ;£¬Ö»ÄÜÓÃÓÚѧÊõÑо¿¡£¾ßÌåÔÒòÓÐÈý£º 1. LLaMAÊÇÒ»¸ö·ÇÉÌÒµÐí¿ÉµÄÄ£ÐÍ£¬AlpacaÊÇ»ùÓÚ¸ÃÄ£ÐÍÉú³ÉµÄ£» 2. Ö¸ÁîÊý¾ÝÊÇ»ùÓÚOpenAIµÄtext-davinci-003£¬ÆäʹÓÃÌõ¿î½ûÖ¹¿ª·¢ÓëOpenAI¾ºÕùµÄÄ£ÐÍ£» 3. ûÓÐÉè¼Æ×ã¹»¶àµÄ°²È«´ëÊ©£¬ËùÒÔAlpaca»¹Ã»ÓÐ×öºÃ¹ã·ºÊ¹ÓõÄ×¼±¸ ³ý´ËÖ®Í⣬˹̹¸£Ñо¿ÈËÔ±×ܽáÁËAlpacaδÀ´Ñо¿»áÓÐÈý¸ö·½Ïò¡£
´ÓHELM£¨ÓïÑÔÄ£Ð͵ÄÕûÌåÆÀ¹À£©¿ªÊ¼²¶×½¸ü¶àµÄÉú³ÉÐÔ¡¢×ñÑÖ¸ÁîµÄ³¡¾°¡£
½øÒ»²½Ñо¿AlpacaµÄ·çÏÕ£¬²¢Ê¹ÓÃ×Ô¶¯ºì¶Ó·Ö×é¡¢Éó¼ÆºÍÊÊÓ¦ÐÔ²âÊԵȷ½·¨Ìá¸ßÆä°²È«ÐÔ¡£
Ï£ÍûÄܸüºÃµØÀí½âÄ£ÐÍÄÜÁ¦ÊÇÈçºÎ´ÓѵÁ··½·¨ÖвúÉúµÄ¡£ÐèÒª»ù´¡Ä£Ð͵ÄʲôÊôÐÔ£¿À©´óÄ£Ð͹æÄ£Ê±»á·¢Éúʲô£¿ÐèÒªÖ¸ÁîÊý¾ÝµÄʲôÊôÐÔ£¿ÔÚGPT-3.5ÉÏ£¬³ýÁËʹÓÃ×ÔÉú³ÉÖ¸Á»¹ÓÐÊ²Ã´Ìæ´ú·½·¨£¿ ´óÄ£Ð͵ÄStable Diffusion ÏÖÔÚ£¬Ë¹Ì¹¸£¡¸ÑòÍÕ¡¹Ö±½Ó±»ÍøÓÑ·îΪ¡¸Îı¾´óÄ£Ð͵ÄStable Diffusion¡¹¡£ MetaµÄLLaMAÄ£ÐÍ¿ÉÒÔÃâ·Ñ¸øÑо¿ÈËԱʹÓ㨵±È»ÐèÒªÉêÇëºó£©¼òÖ±ÀûºÃAIȦÓÑÃÇ¡£ ×ÔChatGPTºá¿Õ³öÊÀÒÔÀ´£¬ÈÃÐí¶àÈ˶ÔAIÄ£Ð͵ÄÄÚÖÃÏÞÖÆ¸Ðµ½¾ÚÉ¥¡£ÕâЩÏÞÖÆ×èÖ¹ChatGPTÌÖÂÛOpenAIÈÏΪÃô¸ÐµÄ»°Ìâ¡£
Òò´Ë£¬AIÉçÇø±ãÏ£ÍûÄܹ»ÓÐÒ»¸ö¿ªÔ´´óÓïÑÔÄ£ÐÍ£¨LLM£©£¬ÈκÎÈ˶¼¿ÉÒÔÔÚ±¾µØÔËÐжøÎÞÐèÉó²é£¬Ò²ÎÞÐèÏòOpenAIÖ§¸¶API·ÑÓᣠҪ˵ÕâÑù¿ªÔ´´óÄ£ÐÍÏÖÔÚÒ²ÓУ¬±ÈÈçGPT-J£¬µ«ÃÀÖв»×ãµÄÊÇÐèÒª´óÁ¿µÄGPUÄÚ´æºÍ´æ´¢¿Õ¼ä¡£ ÁíÒ»·½Ã棬ÆäËû¿ªÔ´Æ½Ìæ°æÎÞ·¨ÔÚÏֳɵÄÏû·Ñ¼¶Ó²¼þÉÏÓµÓÐGPT-3¼¶±ðµÄÐÔÄÜ¡£ 2Ôµף¬MetaÍÆ³öÁË×îеÄÓïÑÔÄ£ÐÍLLaMA£¬²ÎÊýÁ¿·Ö±ðÊÇ70ÒÚ£¨7B£©¡¢130ÒÚ£¨13B£©¡¢330ÒÚ£¨33B£©ºÍ650ÒÚ£¨65B£©¡£ÆÀ²â½á¹ûÏÔʾ£¬Æä13B°æ±¾±ã¿ÉÒÔÓëGPT-3ÏàæÇÃÀ¡£
ÂÛÎĵØÖ·£ºhttps://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ ËäÈ»MetaÏòͨ¹ýÉêÇëµÄÑо¿ÈËÔ±¿ª·ÅÔ´´úÂ룬µ«Ã»Ïëµ½ÍøÓÑ×îÏÈÔÚGitHubÉÏй©ÁËLLaMAµÄÈ¨ÖØ¡£ ×Ô´Ë£¬Î§ÈÆLLaMAÓïÑÔÄ£Ð͵ķ¢Õ¹³Ê±¬Õ¨Ê½Ôö³¤¡£ ͨ³££¬ÔËÐÐGPT-3ÐèÒª¶à¸öÊý¾ÝÖÐÐļ¶A100 GPU£¬ÔÙ¼ÓÉÏGPT-3µÄÈ¨ÖØ²»Êǹ«¿ªµÄ¡£ ÍøÓÑ·×·××Ô¼º¡¸²Ùµ¶¡¹ÔËÐÐLLaMAÄ£ÐÍһʱÒýÆðÁ˺䶯¡£ ͨ¹ýÁ¿»¯¼¼Êõ¶ÔÄ£ÐÍ´óС½øÐÐÓÅ»¯£¬LLaMAÏÖÔÚ¿ÉÒÔÔÚM1 Mac¡¢½ÏСNvidiaÏû·ÑÕßGPU¡¢Pixel 6ÊÖ»ú¡¢ÉõÖÁÊÇÊ÷Ý®ÅÉÉÏÔËÐС£ ÍøÓÑ×ܽáÁË£¬´ÓLLaMAµÄ·¢²¼µ½ÏÖÔÚ£¬´ó¼ÒÀûÓÃLLaMA×ö³öµÄһЩ³É¹û£º
2ÔÂ24ÈÕ£¬LLaMA·¢²¼£¬²¢ÔÚ·ÇÉÌÒµÐí¿ÉÏÂÌṩ¸øÕþ¸®¡¢ÉçÇøºÍѧÊõ½çµÄÑо¿ÈËÔ±ºÍʵÌ幤×÷Õߣ» 3ÔÂ2ÈÕ£¬4chanÍøÓÑй¶ÁËÈ«²¿µÄLLaMAÄ£ÐÍ£» 3ÔÂ10ÈÕ£¬Georgi Gerganov´´½¨ÁËllama.cpp¹¤¾ß£¬¿ÉÒÔÔÚ´îÔØM1/M2оƬµÄMacÉÏÔËÐÐLLaMA£» 3ÔÂ11ÈÕ£ºÍ¨¹ýllama.cpp¿ÉÒÔÔÚ4GB RaspberryPiÉÏÔËÐÐ7BÄ£ÐÍ£¬µ«ËٶȱȽÏÂý£¬Ö»ÓÐ10Ãë/token£» 3ÔÂ12ÈÕ£ºLLaMA 7BÔÚÒ»¸önode.jsÖ´Ðй¤¾ßNPXÉϳɹ¦ÔËÐУ» 3ÔÂ13ÈÕ£ºllama.cpp¿ÉÒÔÔÚPixel 6ÊÖ»úÉÏÔËÐУ» ¶øÏÖÔÚ£¬Ë¹Ì¹¸£Alpaca¡¸ÑòÍÕ¡¹·¢²¼¡£ One More Thing ÏîĿû·Å³ö¶à¾Ã£¬Alpaca»ð±¬µ½Ö±½Ó²»ÄÜÓÃÁË....
Ðí¶àÍøÓѳ³³³£¬µã¡¸Éú³É¡¹Ã»·´Ó¦£¬»¹ÓеÄÔÚÅŶӵÈÍæ¶ù¡£
|
