ÎÄÕÂ
  • ÎÄÕÂ
搜索
Ê×Ò³ >> ¿Æ¼¼ >>ÐÂÏʿƼ¼ >> LeCun¿ñÔÞ£º600µ¶GPT-3.5Æ½Ìæ£¡ ˹̹¸£70ÒÚ²ÎÊý¡¸ÑòÍÕ¡¹±¬»ð£¬LLaMAɱ·èÁË
¿Æ¼¼
更多
²©¿Í
更多
详细内容

LeCun¿ñÔÞ£º600µ¶GPT-3.5Æ½Ìæ£¡ ˹̹¸£70ÒÚ²ÎÊý¡¸ÑòÍÕ¡¹±¬»ð£¬LLaMAɱ·èÁË

时间£º2023-03-15     作者£ºÎâÀÏʦ¹ÉƱºÏ×÷¡¾原创¡¿   阅读

MetaµÄLLaMAÄ£ÐÍ¿ªÔ´£¬ÈÃÎı¾´óÄ£ÐÍÓ­À´ÁËStable Diffustionʱ¿Ì¡£½ñÌ죬˹̹¸£·¢²¼ÁËÒ»¸öÓÉLLaMA 7B΢µ÷µÄÄ£ÐÍAlpaca£¬ÑµÁ·3Сʱ£¬ÐÔÄܱȼçGPT-3.5¡£

Ò»¾õÐÑÀ´£¬Ë¹Ì¹¸£´óÄ£ÐÍAlpaca£¨²ÝÄàÂí£©»ðÁË¡£


û´í£¬AlpacaÊÇÓÉMetaµÄLLaMA 7B΢µ÷¶øÀ´µÄÈ«ÐÂÄ£ÐÍ£¬½öÓÃÁË52kÊý¾Ý£¬ÐÔÄÜÔ¼µÈÓÚGPT-3.5¡£

¹Ø¼üÊÇѵÁ·³É±¾ÆæµÍ£¬²»µ½600ÃÀÔª¡£¾ßÌ廨·ÑÈçÏ£º

ÔÚ8¸ö80GB A100ÉÏѵÁ·ÁË3¸öСʱ£¬²»µ½100ÃÀÔª£»

Éú³ÉÊý¾ÝʹÓÃOpenAIµÄAPI£¬500ÃÀÔª¡£


˹̹¸£´óѧ¼ÆËã»ú¿ÆÑ§¸±½ÌÊÚPercy Liang³Æ£¬


ÓÉÓÚȱ·¦Í¸Ã÷¶È/ÎÞ·¨ÍêÈ«·ÃÎÊÏñGPT 3.5ÕâÑùµÄÓÐÄÜÁ¦µÄÖ¸ÁîÄ£ÐÍ£¬½ø¶øÏÞÖÆÁËÕâÒ»ÖØÒªÁìÓòµÄѧÊõÑо¿¡£ÎÒÃÇÔÚ Alpaca £¨LLaMA 7B + text-davinci-003£©ÉÏÂõ³öÁËһС²½¡£



¿´µ½ÓÖÓÐÈËÔÚ×Ô¼Ò´óÄ£ÐÍÉÏÈ¡µÃÁËеijɹû£¬Yann LeCun·è¿ñת·¢£¨Ðû´«Òªµ½Î»£©¡£



3Сʱ΢µ÷70ÒÚ²ÎÊý£¬600ÃÀÔª¸ã¶¨

»°²»¶à˵£¬ÏÈÊÔÓÃÒ»²¨¡£

ÎÊ£º¸æËßÎÒһЩ¹ØÓÚÑòÍÕµÄÊÂÇé¡£

´ð£ºÑòÍÕÊÇÀ´×ÔÄÏÃÀÖÞµÄÂæÍÕÆ·ÖÖ£¬ÓëÃÀÖÞÍÕºÍÂæÍÕÓйء£ËüÃÇͨ³£ÒòÆäÏËά¶ø±»ËÇÑø£¬ÓÃÓÚÖÆÔìÉÝ³ÞÆ·£¬ÈçëÒºÍë̺¡£ÓÉÓÚÑòÍÕµÄÎÂÈáºÍÓѺõÄÌìÐÔ£¬ËüÃÇÒ²ÊǺÜÊÜ»¶Ó­µÄ³èÎï¡£


ÌåÑéÁ´½Ó£ºhttps://crfm.stanford.edu/alpaca/


¶ÔÓÚ˹̹¸£µÄÍŶÓÀ´Ëµ£¬ÏëÒªÔÚÔ¤ËãÄÚѵÁ·Ò»¸ö¸ßÖÊÁ¿µÄÖ¸Áî×ñÑ­Ä£ÐÍ£¬¾Í±ØÐëÃæÁÙ2¸öÖØÒªµÄÌôÕ½£ºÒªÓÐÒ»¸öÇ¿´óµÄԤѵÁ·ÓïÑÔÄ£ÐÍ£¬ÒÔ¼°Ò»¸ö¸ßÖÊÁ¿µÄÖ¸Áî×ñÑ­Êý¾Ý¡£

ǡǡ£¬Ìṩ¸øÑ§ÊõÑо¿ÈËԱʹÓõÄLLaMAÄ£Ð͸㶨Á˵ÚÒ»¸öÎÊÌâ¡£

¶ÔÓÚµÚ¶þ¸öÌôÕ½£¬¡¸Self-Instruct: Aligning Language Model with Self Generated Instructions¡¹ÂÛÎĸøÁËºÜºÃµÄÆô·¢£¬¼´Ê¹ÓÃÏÖÓеÄÇ¿ÓïÑÔÄ£ÐÍÀ´×Ô¶¯Éú³ÉÖ¸ÁîÊý¾Ý¡£

È»¶ø£¬LLaMAÄ£ÐÍ×î´óµÄÈõµãÊÇȱ·¦Ö¸Áî΢µ÷¡£OpenAI×î´óµÄ´´ÐÂÖ®Ò»¾ÍÊǽ«Ö¸Áîµ÷ÓÅÓÃÔÚÁËGPT-3ÉÏ¡£

¶Ô´Ë£¬Ë¹Ì¹¸£Ê¹ÓÃÁËÏÖÓеĴóÓïÑÔÄ£ÐÍ£¬À´×Ô¶¯Éú³É×ñÑ­Ö¸ÁîÑÝʾ¡£


Ê×ÏÈ´Ó×ÔÉú³ÉÖ¸ÁîÖÖ×Ó¼¯ÖеÄ175¸öÈ˹¤±àдµÄ¡¸Ö¸Áî-Êä³ö¡¹¶Ô¿ªÊ¼£¬È»ºó£¬Ìáʾtext-davinci-003ʹÓÃÖÖ×Ó¼¯×÷ΪÉÏÏÂÎÄʾÀýÀ´Éú³É¸ü¶àÖ¸Áî¡£

ͨ¹ý¼ò»¯Éú³É¹ÜµÀ¸Ä½øÁË×ÔÉú³ÉÖ¸ÁîµÄ·½·¨£¬ÕâÑù´ó´ó½µµÍÁ˳ɱ¾¡£ÔÚÊý¾ÝÉú³É¹ý³ÌÖУ¬²úÉúÁË52K¸ö¶ÀÌØÖ¸ÁîºÍÏàÓ¦µÄÊä³ö£¬Ê¹ÓÃOpenAI APIµÄ³É±¾²»µ½500ÃÀÔª¡£

ÓÐÁËÕâ¸öÖ¸Áî×ñÑ­µÄÊý¾Ý¼¯£¬Ñо¿ÈËÔ±ÀûÓÃHugging FaceµÄѵÁ·¿ò¼Ü¶ÔLLaMAÄ£ÐͽøÐÐ΢µ÷£¬ÀûÓÃÁËÍêÈ«·ÖƬÊý¾Ý²¢ÐУ¨FSDP£©ºÍ»ìºÏ¾«¶ÈѵÁ·µÈ¼¼Êõ¡£


ÁíÍ⣬΢µ÷Ò»¸ö7BµÄLLaMAÄ£ÐÍÔÚ8¸ö80GBµÄA100ÉÏ»¨ÁË3¸ö¶àСʱ£¬ÔÚ´ó¶àÊýÔÆ¼ÆË㹩ӦÉÌÄÇÀïµÄ³É±¾²»µ½100ÃÀÔª¡£

Ô¼µÈÓÚGPT-3.5

ΪÁËÆÀ¹ÀAlpaca£¬Ë¹Ì¹¸£Ñо¿ÈËÔ±¶Ô×ÔÉú³ÉÖ¸ÁîÆÀ¼Û¼¯µÄÊäÈë½øÐÐÁËÈ˹¤ÆÀ¹À£¨ÓÉ5λѧÉú×÷Õß½øÐУ©¡£

Õâ¸öÆÀ¼Û¼¯ÊÇÓÉ×ÔÉú³ÉÖ¸Áî×÷ÕßÊÕ¼¯µÄ£¬º­¸ÇÁ˶àÑù»¯µÄÃæÏòÓû§µÄÖ¸Á°üÀ¨µç×ÓÓʼþд×÷¡¢É罻ýÌåºÍÉú²úÁ¦¹¤¾ßµÈ¡£

ËûÃǶÔGPT-3.5£¨text-davinci-003£©ºÍAlpaca 7B½øÐÐÁ˱Ƚϣ¬·¢ÏÖÕâÁ½¸öÄ£Ð͵ÄÐÔÄܷdz£ÏàËÆ¡£AlpacaÔÚÓëGPT-3.5µÄ±È½ÏÖУ¬»ñʤ´ÎÊýΪ90¶Ô89¡£

¼øÓÚÄ£Ð͹æÄ£½ÏС£¬ÇÒÖ¸ÁîÊý¾ÝÁ¿²»´ó£¬È¡µÃÕâ¸ö½á¹ûÒѾ­ÊÇÏ൱¾ªÈËÁË¡£

³ýÁËÀûÓÃÕâ¸ö¾²Ì¬ÆÀ¹À¼¯£¬ËûÃÇ»¹¶ÔAlpacaÄ£ÐͽøÐÐÁ˽»»¥Ê½²âÊÔ£¬·¢ÏÖAlpacaÔÚ¸÷ÖÖÊäÈëÉϵıíÏÖÍùÍùÓëGPT-3.5ÏàËÆ¡£

˹̹¸£ÓÃAlpaca½øÐеÄÑÝʾ£º

ÑÝʾһÈÃAlpacaÀ´Ì¸Ì¸×Ô¼ººÍLLaMAµÄÇø±ð¡£


ÑÝʾ¶þÈÃAlpacaдÁËÒ»·âÓʼþ£¬ÄÚÈݼò½àÃ÷ÁË£¬¸ñʽҲºÜ±ê×¼¡£


ÉÏÊöÀý×Ó¿ÉÒÔ¿´³ö£¬AlpacaµÄÊä³ö½á¹ûÒ»°ã¶¼Ð´µÃ²»´í£¬¶øÇÒ´ð°¸Í¨³£±ÈChatGPT¼ò¶Ì£¬ÌåÏÖÁËGPT-3.5½Ï¶ÌÊä³öµÄ·ç¸ñ¡£

µ±È»ÁË£¬Alpaca±íÏÖ³öÓïÑÔÄ£Ðͳ£¼ûµÄȱÏÝ¡£

±ÈÈ磬½«Ì¹É£ÄáÑǵÄÊ×¶¼Ëµ³ÉÁË´ïÀÛË¹ÈøÀ­Ä·¡£ÊµÔò£¬1974ÄêÖ®ºó£¬¶à¶àÂíÊÇ̹ɣÄáÑǵÄÐÂÊ×¶¼ÁË£¬´ïÀÛË¹ÈøÀ­Ä·Ö»ÊÇ̹ɣÄáÑÇ×î´óµÄ³ÇÊС£


׫дÖÜÏêµÄÂÛÎÄժҪʱ£¬Alpaca´«²¥ÁË´íÎóµÄÐÅÏ¢¡£


ÁíÍ⣬Alpaca¿ÉÄÜ»¹´æÔÚÐí¶àÓëµ×²ãÓïÑÔÄ£ÐͺÍÖ¸Áî΢µ÷Êý¾ÝÏà¹ØµÄ¾ÖÏÞ¡£È»¶ø£¬AlpacaΪÎÒÃÇÌṩÁËÒ»¸öÏà¶ÔÇáÁ¿¼¶µÄÄ£ÐÍ£¬Ëü¿ÉÒÔ³ÉΪδÀ´Ñо¿´óÄ£ÐÍÖØÒªÈ±ÏݵĻù´¡¡£

Ŀǰ£¬Ë¹Ì¹¸£½ö¹«²¼ÁËAlpacaµÄѵÁ··½·¨ºÍÊý¾Ý£¬²¢´òËãÔÚδÀ´·¢²¼Ä£Ð͵ÄÈ¨ÖØ¡£

µ«ÊÇ£¬AlpacaÊDz»ÄÜÓÃÓÚÉÌÒµÓÃ;£¬Ö»ÄÜÓÃÓÚѧÊõÑо¿¡£¾ßÌåÔ­ÒòÓÐÈý£º

1. LLaMAÊÇÒ»¸ö·ÇÉÌÒµÐí¿ÉµÄÄ£ÐÍ£¬AlpacaÊÇ»ùÓÚ¸ÃÄ£ÐÍÉú³ÉµÄ£»

2. Ö¸ÁîÊý¾ÝÊÇ»ùÓÚOpenAIµÄtext-davinci-003£¬ÆäʹÓÃÌõ¿î½ûÖ¹¿ª·¢ÓëOpenAI¾ºÕùµÄÄ£ÐÍ£»

3. ûÓÐÉè¼Æ×ã¹»¶àµÄ°²È«´ëÊ©£¬ËùÒÔAlpaca»¹Ã»ÓÐ×öºÃ¹ã·ºÊ¹ÓõÄ×¼±¸

³ý´ËÖ®Í⣬˹̹¸£Ñо¿ÈËÔ±×ܽáÁËAlpacaδÀ´Ñо¿»áÓÐÈý¸ö·½Ïò¡£



  • ÆÀ¹À£º



´ÓHELM£¨ÓïÑÔÄ£Ð͵ÄÕûÌåÆÀ¹À£©¿ªÊ¼²¶×½¸ü¶àµÄÉú³ÉÐÔ¡¢×ñÑ­Ö¸ÁîµÄ³¡¾°¡£



  • °²È«£º



½øÒ»²½Ñо¿AlpacaµÄ·çÏÕ£¬²¢Ê¹ÓÃ×Ô¶¯ºì¶Ó·Ö×é¡¢Éó¼ÆºÍÊÊÓ¦ÐÔ²âÊԵȷ½·¨Ìá¸ßÆä°²È«ÐÔ¡£



  • Àí½â£º



Ï£ÍûÄܸüºÃµØÀí½âÄ£ÐÍÄÜÁ¦ÊÇÈçºÎ´ÓѵÁ··½·¨ÖвúÉúµÄ¡£ÐèÒª»ù´¡Ä£Ð͵ÄʲôÊôÐÔ£¿À©´óÄ£Ð͹æÄ£Ê±»á·¢Éúʲô£¿ÐèÒªÖ¸ÁîÊý¾ÝµÄʲôÊôÐÔ£¿ÔÚGPT-3.5ÉÏ£¬³ýÁËʹÓÃ×ÔÉú³ÉÖ¸Á»¹ÓÐÊ²Ã´Ìæ´ú·½·¨£¿

´óÄ£Ð͵ÄStable Diffusion

ÏÖÔÚ£¬Ë¹Ì¹¸£¡¸ÑòÍÕ¡¹Ö±½Ó±»ÍøÓÑ·îΪ¡¸Îı¾´óÄ£Ð͵ÄStable Diffusion¡¹¡£

MetaµÄLLaMAÄ£ÐÍ¿ÉÒÔÃâ·Ñ¸øÑо¿ÈËԱʹÓ㨵±È»ÐèÒªÉêÇëºó£©¼òÖ±ÀûºÃAIȦÓÑÃÇ¡£

×ÔChatGPTºá¿Õ³öÊÀÒÔÀ´£¬ÈÃÐí¶àÈ˶ÔAIÄ£Ð͵ÄÄÚÖÃÏÞÖÆ¸Ðµ½¾ÚÉ¥¡£ÕâЩÏÞÖÆ×èÖ¹ChatGPTÌÖÂÛOpenAIÈÏΪÃô¸ÐµÄ»°Ìâ¡£


Òò´Ë£¬AIÉçÇø±ãÏ£ÍûÄܹ»ÓÐÒ»¸ö¿ªÔ´´óÓïÑÔÄ£ÐÍ£¨LLM£©£¬ÈκÎÈ˶¼¿ÉÒÔÔÚ±¾µØÔËÐжøÎÞÐèÉó²é£¬Ò²ÎÞÐèÏòOpenAIÖ§¸¶API·ÑÓá£

Ҫ˵ÕâÑù¿ªÔ´´óÄ£ÐÍÏÖÔÚÒ²ÓУ¬±ÈÈçGPT-J£¬µ«ÃÀÖв»×ãµÄÊÇÐèÒª´óÁ¿µÄGPUÄÚ´æºÍ´æ´¢¿Õ¼ä¡£

ÁíÒ»·½Ã棬ÆäËû¿ªÔ´Æ½Ìæ°æÎÞ·¨ÔÚÏֳɵÄÏû·Ñ¼¶Ó²¼þÉÏÓµÓÐGPT-3¼¶±ðµÄÐÔÄÜ¡£

2Ôµף¬MetaÍÆ³öÁË×îеÄÓïÑÔÄ£ÐÍLLaMA£¬²ÎÊýÁ¿·Ö±ðÊÇ70ÒÚ£¨7B£©¡¢130ÒÚ£¨13B£©¡¢330ÒÚ£¨33B£©ºÍ650ÒÚ£¨65B£©¡£ÆÀ²â½á¹ûÏÔʾ£¬Æä13B°æ±¾±ã¿ÉÒÔÓëGPT-3ÏàæÇÃÀ¡£


ÂÛÎĵØÖ·£ºhttps://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/

ËäÈ»MetaÏòͨ¹ýÉêÇëµÄÑо¿ÈËÔ±¿ª·ÅÔ´´úÂ룬µ«Ã»Ïëµ½ÍøÓÑ×îÏÈÔÚGitHubÉÏй©ÁËLLaMAµÄÈ¨ÖØ¡£

×Ô´Ë£¬Î§ÈÆLLaMAÓïÑÔÄ£Ð͵ķ¢Õ¹³Ê±¬Õ¨Ê½Ôö³¤¡£

ͨ³££¬ÔËÐÐGPT-3ÐèÒª¶à¸öÊý¾ÝÖÐÐļ¶A100 GPU£¬ÔÙ¼ÓÉÏGPT-3µÄÈ¨ÖØ²»Êǹ«¿ªµÄ¡£

ÍøÓÑ·×·××Ô¼º¡¸²Ùµ¶¡¹ÔËÐÐLLaMAÄ£ÐÍһʱÒýÆðÁ˺䶯¡£

ͨ¹ýÁ¿»¯¼¼Êõ¶ÔÄ£ÐÍ´óС½øÐÐÓÅ»¯£¬LLaMAÏÖÔÚ¿ÉÒÔÔÚM1 Mac¡¢½ÏСNvidiaÏû·ÑÕßGPU¡¢Pixel 6ÊÖ»ú¡¢ÉõÖÁÊÇÊ÷Ý®ÅÉÉÏÔËÐС£

ÍøÓÑ×ܽáÁË£¬´ÓLLaMAµÄ·¢²¼µ½ÏÖÔÚ£¬´ó¼ÒÀûÓÃLLaMA×ö³öµÄһЩ³É¹û£º


2ÔÂ24ÈÕ£¬LLaMA·¢²¼£¬²¢ÔÚ·ÇÉÌÒµÐí¿ÉÏÂÌṩ¸øÕþ¸®¡¢ÉçÇøºÍѧÊõ½çµÄÑо¿ÈËÔ±ºÍʵÌ幤×÷Õߣ»

3ÔÂ2ÈÕ£¬4chanÍøÓÑй¶ÁËÈ«²¿µÄLLaMAÄ£ÐÍ£»

3ÔÂ10ÈÕ£¬Georgi Gerganov´´½¨ÁËllama.cpp¹¤¾ß£¬¿ÉÒÔÔÚ´îÔØM1/M2оƬµÄMacÉÏÔËÐÐLLaMA£»

3ÔÂ11ÈÕ£ºÍ¨¹ýllama.cpp¿ÉÒÔÔÚ4GB RaspberryPiÉÏÔËÐÐ7BÄ£ÐÍ£¬µ«ËٶȱȽÏÂý£¬Ö»ÓÐ10Ãë/token£»

3ÔÂ12ÈÕ£ºLLaMA 7BÔÚÒ»¸önode.jsÖ´Ðй¤¾ßNPXÉϳɹ¦ÔËÐУ»

3ÔÂ13ÈÕ£ºllama.cpp¿ÉÒÔÔÚPixel 6ÊÖ»úÉÏÔËÐУ»

¶øÏÖÔÚ£¬Ë¹Ì¹¸£Alpaca¡¸ÑòÍÕ¡¹·¢²¼¡£

One More Thing

ÏîĿû·Å³ö¶à¾Ã£¬Alpaca»ð±¬µ½Ö±½Ó²»ÄÜÓÃÁË....


Ðí¶àÍøÓѳ³³³£¬µã¡¸Éú³É¡¹Ã»·´Ó¦£¬»¹ÓеÄÔÚÅŶӵÈÍæ¶ù¡£


最新评论
请先登录才能进行回复登录

Copyright @ 2018 . All rights reserved.

Õã¹«Íø°²±¸33068102001146ºÅ

  • 电话直呼

    • 15050108135
    • ÎâÀÏʦ £º
    • ÎâÀÏʦ £º
    • ÎâÀÏʦ £º
    • ÎâÀÏʦ £º
技术支持£º CLOUD | 管理登录
seo seo