文章目录一、企业镜像源1、阿里云2、网易1633、搜狐镜像4、华为二:高校镜像源1、清华源2、北京大学3、中国科学技术大学源(USTC)4、上海交通大学5、山东大学6、吉林大学开源镜像站7、哈尔滨工业大学开源镜像站8、西安交通大学软件镜像站9、兰州大学10、北京理工11、浙江大学三:pip镜像源1、清华镜像源2、豆瓣镜像源3、阿里镜像源4、中国科学技术大学5、中国科技大学6、中国科学技术大学7、华中理工大学8、山东理工大学一、企业镜像源1、阿里云网址:https://developer.aliyun.com/mirror/选择ubuntu然后会找到软件源的网址2、网易163网址:http://
在当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。在备受瞩目的AIforMath领域,由于高质量的数学语料相对稀缺,这限制了生成式人工智能在数学应用方面的潜力。为了应对这一挑战,上海交通大学生成式人工智能实验室推出了「MathPile」。这是一套专门针对数学领域的高质量、多样化预训练语料库,其中包含约95亿tokens,旨在提升大型模型在数学推理方面的能力。此外,实验室还推出了MathPile的商业版——「MathPile_Commercial」,进一步拓宽其应用范围和商业潜力。论
随着深度神经网络(DNNs)模型在规模和复杂性上的迅速增长,传统的神经网络处理方法面临着严峻的挑战。现有的神经网络压缩技术在处理参数规模大、精度要求高的神经网络模型时效率低下,无法满足现有应用的需求。数值量化是神经网络模型压缩的一种有效手段。在模型推理过程中,低位宽(比特)数据的存取和计算可以大幅度节省存储空间、访存带宽与计算负载,从而降低推理延迟和能耗。当前,大多数量化技术的位宽在8bit。更为激进的量化算法,必须要修改硬件的操作粒度与数据流特征,才能在真实推理时获得接近理论的收益。比如混合精度量化,激活数据的量化等方案。一方面,这些方案会显式增加book-keeping存储开销和硬件逻辑,
CLIP是目前最流行的视觉基座模型,其应用场景包括但不限于:与LLM大语言模型结合成为视觉多模态大模型;作为图像生成(StableDiffusion)、点云生成(Point-E)的conditionmodel,实现image-to-3D;用于指导NeRF的优化方向从而实现text-to-3D;本身用于开放类别的识别和检测。但CLIP必须以整张图片作为输入并进行特征提取,无法关注到指定的任意区域,不过自然的2D图片中往往包含不同的物体,part和thing,如果能由用户或检测模型指定需要关注的区域,在图像编码的过程就确定需要关注的对象,将会提升CLIP模型的可控制性和区域检测能力。为此,上海交通
要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现,这两步都不是必要的???新论文指出,预训练完成刚出炉的基础模型已经掌握了遵循指令的能力,只需要提示工程就能引导出来,引起开发社区强烈关注。因为RLHF的成本非常高训练还不稳定,这样可就省了大钱了。研究据此提出一种新的免微调对齐法URIAL。论文中把新方法形容为“解锁基础模型潜力的咒语”,能够节省大量算力资源和时间。更值得关注的是,不掌握稳定RLHF(人类强化学习)能力的小型团队,也能低成本开发出可以聊天对话、遵循指令的对齐模型了。目前URIAL代码和新评估基准Jus
大模型的出现引发了智能体设计的革命性变革,在ChatGPT及其插件系统问世后,对大模型智能体的设计和开发吸引了极大的关注。帮助完成预订、下单等任务,协助编写文案,自主从网络上搜索最新的知识与新闻等等,这种通用、强大的智能助理,让大模型强大的语义理解、推理能力将之变成了可能。OpenAI首届开发者大会上,SamAltman展示了ChatGPT作为智能助理的可能性。为了提升大模型智能体交互的性能和可靠性,目前学界已经提出了多种基于不同提示语技术的智能体框架,如将思维链结合至决策过程的ReAct、利用大模型的自检查能力的RCI等。尽管大模型智能体已经表现出强大的能力,但上述方案都缺乏让大模型智能体从
雷递网雷建平12月8日宁波远洋运输股份有限公司(简称:“宁波远洋”,股票代码:601022)今日在上交所上市。宁波远洋此次发行价8.22元,发行130,863,334股,募资总额为10.69亿元。宁波远洋开盘价为11.84元,很快公司股价涨停,收盘价为11.84元,以收盘价计算,公司市值为154.94亿元。上半年净利近4亿宁波远洋成立于1992年,专业化经营两岸、中日、中韩、东南亚集装箱班轮航线及国内集装箱内支、内贸航线、国内散货运输及航运辅助业务。截至2022年8月底,公司拥有自有船舶42艘、租赁船舶42艘,形成一支由3,000吨至40,000吨集装箱船舶梯度互补并保有一定数量干散货船舶(8
评估大模型对齐表现最高效的方式是?在生成式AI趋势里,让大模型回答和人类价值(意图)一致非常重要,也就是业内常说的对齐(Alignment)。“让大模型自己上。”这是上海交通大学生成式人工智能研究组(GAIR)提出的最新思路。但是目前的评估方法还存在透明度不够、准确性不佳等问题。所以研究人员开源了一个130亿参数规模的大模型Auto-J,能对评估当下大模型的对齐效果。它可同时分析两个大模型的回答,分别做出评价并进行对比。也能评估单个回复。并且在这一任务上的表现超越了GPT-4。目前,该项目开源了大量资源,包括:Auto-J的130亿参数模型(使用方法、训练和测试数据也已经在GitHub上给出)
随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。虽然模型的对齐至关重要,但目前的评估方法往往存在局限性,这也让开发者往往困惑:大模型对齐程度如何?这不仅制约了对齐技术的进一步发展,也引发了公众对技术可靠性的担忧。为此,上海交通大学生成式人工智能实验室迅速响应,推出了一款全新的价值对齐评估工具:Auto-J,旨在为行业和公众提供更加透明、准确的模型价值对齐评估。论文地址:https://arxiv.org/abs/2310.05470项目地址:https://gair-nlp.github.io/auto-j/代码地址:https:
以ChatGPT为代表的大模型产品引领了一场新的产业革命,激发了国内外各机构积极投入相关技术研究的热情。在过去几个月的技术竞争中,国产大模型在文本理解和知识理解任务方面表现出色,堪称一位优秀的“文科生”。然而,在复杂数学推理计算、物理建模、科学发现等“理科”领域,大模型的研究尚未达到令人满意的水平,与美国顶尖科技公司(OpenAI、Google、Anthropic)相比,仍存在很大差距。例如,在数学推理方面的权威评测集GSM8K和MATH上,美国AI公司一直占据前几名,突显了其领先地位。在这样的背景下,上海交大生成式人工智能研究组(GAIR)积极攻克难关,研发并开源了数学计算大模型“阿贝尔(A