钞能力:阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜
IT之家6月13日消息,众所周知,阿联酋在科技及教育产业方面投入的预算
IT之家 2023-06-13 10:59:06
(资料图片仅供参考)
IT之家 6 月 13 日消息,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所(TII)打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。
▲ 图源 阿联酋科技创新研究所(TII)
据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。
此外,团队还采用了“多重查询注意力”(Multiqery attention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。
阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。
IT之家注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT之家的小伙伴们可以在这里访问。
IT之家6月13日消息,众所周知,阿联酋在科技及教育产业方面投入的预算
618促销火热进行中,各大厂商都开始了促销,国内知名硬件装备品牌攀升
中新网兰州6月12日电(崔琳)12日,甘肃省政府新闻办公室召开新闻发布
中新网上海新闻6月11日电(记者许婧)“绿色低碳发展已成为全球可持续发
海外网6月13日电据美国《华盛顿邮报》等多家媒体6月12日报道,美国前总
《军武次位面》作者:路芷近日,俄罗斯击毁了多辆乌克兰的地面装甲车辆
1、泡菜坛创立于2002年,一直以其开放、包容等特性深受市民喜爱。近8年
河南广电·大象新闻记者龚雪通讯员张俊李楚歆肖欣悦近日,“潢川小龙虾
1、淮南充值公交卡地点见下图:持普通卡可乘坐淮南市无人售票线路公交
想必现在有很多小伙伴对于permit的ing形式怎么写方面的知识都比较想要
想必现在有很多小伙伴对于高考成绩单怎么打印方面的知识都比较想要了解
记者王钟玉6月12日,潍坊市公安局交警支队发布城区中考考点周边交通出
近日,广联达在2023年投资者大会上,接待了光大证券、嘉实基金、瑞银证
证券之星讯,根据6月12日市场公开信息、上市公司公告及交易所披露数据
6月9日一段环卫工母亲考场外等待高考儿子两人相拥流泪的视频在网络热传