【{$randkws}】阿里巴巴发布通义千问7B模型 开源免费可商用 支持8K上下文长度 – 蓝点网 - {$web_name} 这个模型含有两个子模型
今日阿里巴巴亮相旗下大型语言模型商品通义千问 7B 参数模型已然开源,该模型为完全开源、免费、可商用。这个模型含有两个子模型,有些工作,一见钟情一个是汇率变化汇总通用型的 Qwen-7B 模型,另一个是对话模型 Qweb-7B-Chat,两个模型均为开源免费可商用。
这两个模型当下已然在阿里达摩院的魔搭小区和国外知名 AI 模型小区 Hugging Face 启动,有兴趣的使用者可以获取模型开展评测。

魔搭小区:https://modelscope.cn/models/qwen/Qwen-7B/summary
Hugging Face:https://huggingface.co/Qwen/Qwen-7B
Github:https://github.com/QwenLM/Qwen-7B
以下是阿里云对 Qwen-7B 模型的自述:
通义千问 – 7B(Qwen-7B) 是阿里云开发的通义千问模型系列的 70 亿参数规模的模型。Qwen-7B 是基于 Transformer 的大语言模型,在超大规模的春季独家收视率预训练资料上开展训练得到。预训练资料类型多样,覆盖广泛,含有众多联网文本、专业书籍、沈腾相关节能减排引关注代码等。另外,在 Qwen-7B 的基础上,我们使用对齐机制兴办了基于大语言模型的 AI 助手 Qwen-7B-Chat。Qwen-7B 系列模型的特色含有:
大规模高品质预训练资料:我们使用了超过 2.2 万亿 token 的自建大规模预训练资料集开展语言模型的预训练。资料集含有文本和代码等各式资料类型,覆盖通用领域和专业领域。
优秀的模型表现:相比同规模的开源模型,Qwen-7B 在多个评测资料集上具有显著长处,乃至超出 12-13B 等更大规模的模型。评测评估的能力范围含有自然语言理解与生成、数学运算解题、代码生成等。
更好地扶持多语言:基于更大词表的分词器在分词上更高效,另外它对其他语言表现更为友好。使用者可以在 Qwen-7B 的基础上更便捷地训练特定语言的 7B 语言模型。
8K 的上下文长度:Qwen-7B 及 Qwen-7B-Chat 均能扶持 8K 的上下文长度,允许使用者输入更长的 prompt。
扶持插件调用:Qwen-7B-Chat 针对插件调用有关的对齐资料做了特定完善,当前模型能有效调用插件以及升级为 Agent。
上一篇:恐怖游戏新作《KLETKA》Steam推出体验版可以4名玩家联机
下一篇:IP解码,以游破界