发布于 13 天前  10 次阅读


微软开源 WizardLM-2,70B优于GPT4-0613,7B持平阿里最新的Qwen1.5-32B 。

根据微软官方描述,WizardLM-2 8x22B是最先进的型号,与那些领先的专有作品相比,表现出极具竞争力的性能,并且始终优于所有现有的最先进的开源模型,性能只是稍微落后于gpt -4-1106预览版,明显强于Command R Plus和GPT4-0314。

WizardLM-2 70B达到了顶级的推理能力,是同尺寸的首选,优于GPT4-0613、Mistral-Large、Qwen1.5-72B-Chat。

Wizardlm - 2 7B是最快的,并达到与现有的10倍大的开源领先模型相当的性能,与Qwen1.5-32B-Chat相当,超过了Qwen1.5-14B-Chat和Starling-LM-7B-beta。

我只能说一句:牛逼!问题来了,谁第一时间下载了7B未经过安全测试的模型?我想玩玩……

微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B,权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说,原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示,微软的 AI 政策要求,在发布任何 AI 模型前,必须首先获得公司委员会 Deployment Safety Board 的批准,该委员会将测试模型是否能执行有害任务,如生成暴力或令人不安的内容。WizardLM-2-7B 模型能完成文本生成、代码建议、翻译不同语言,或解决数学问题等任务。

最后更新于 2024-04-18