“ 开源日报 | 首个“开源AI程序员”;中国大部分模型都是“套壳”;CEO要求关闭实习生上班时间提交的PR;龙芯电脑走进中小学 日报 ”
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.4.3
今日要点
XZ 开源攻击时间线
Go 开发团队技术 leader Russ Cox (rsc)为这次 XZ 后门的社会工程行为构建了详细时间线,该攻击似乎可以追溯到 2021 年底。他说道,该攻击于 2024 年 3 月 29 日公开披露,似乎是针对广泛使用的开源软件的首次已知严重供应链攻击。无论好坏,它标志着开源供应链安全的一个分水岭时刻。
AMD 长期开源 Linux 图形驱动程序倡导者退休
在 ATI/AMD 工作了四分之一个多世纪,John Bridgman 正式宣布退休。John Bridgman 是一位知名的工程师,在开源社区中以其在 Linux 内核和 Mesa 3D 图形库方面的工作而闻名。特别以在开源图形驱动方面的贡献而著称,尤其是在 AMD Radeon 显卡的驱动程序方面。
Bridgman 在 AMD 工作期间,致力于推动开源 GPU 驱动的开发,包括对 AMD HSA异构系统架构在 Linux 平台上的支持。他的工作对提升 Linux 系统上的图形性能和开源软件的可用性产生了重要影响。
元象首个 MoE 大模型开源无条件免费商用、4.2B 激活参数
元象发布 XVERSE-MoE-A4.2B 大模型 ,采用业界最前沿的混合专家模型架构Mixture of Experts,激活参数 4.2B,效果即可媲美 13B 模型。 该模型全开源,无条件免费商用,让海量中小企业、研究者和开发者可在元象高性能 “全家桶” 中按需选用,推动低成本部署。 - Hugging Facehttps://huggingface.co/xverse/XVERSE-MoE-A4.2B - ModelScope 魔搭https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B - Githubhttps://github.com/xverse-ai/XVERSE-MoE-A4.2B
开源大模型AI代理操作系统像Windows一样,操控AI代理
罗格斯大学的研究人员开源了AIOS,这是一种以大模型为核心的AI代理操作系统。可有效解可决随着AI代理的增加,资源调用率低的难题,同时能促进代理之间的上下文切换、实现并发执行代理并维护代理的访问控制。
AIOS的架构和我们使用的PC操作系统差不多,主要分为应用层、内核层和硬件层三大块。
开源地址https://github.com/agiresearch/AIOS 论文地址https://arxiv.org/abs/2403.16971
今日观察
社交观察
2024 开源数据工程生态系统全景图
微信白鲸开源
用不太知名的开源软件时,你们真的信得过吗
很多开源软件的维护者数量很少,用户数却很多。这时候万一哪个维护者动点歪脑筋那么大批设施都会跟着寄。用不太知名的开源软件时,你们真的信得过吗?我自己写东西一般能用标准库就不会碰第三方库,哪怕麻烦一点。
微博 业余早睡选手
ChatGPT不用登录就能用了,但真没啥卵用。。。
首先是免登录版的 ChatGPT ,很明显被阉割过。。。它没历史记录功能,但凡你新开启一个对话,之前的对话就自动删除。 删除就算了,在默认模式下,这些对话还是会被上传到数据库,用来训练优化模型,等于是免费给 OpenAI 打工了。
微信差评
LLaMA 现在在 CPU 上运行得更快
文章主要介绍了作者为llamafile项目编写了84个新的矩阵乘法内核,以提高在CPU上的运行性能。当在CPU上使用F16和Q8_0权重时,llamafile的提示评估时间应该比llama.cpp快30%到500%。对于ARMv8.2+例如树莓派 5、Intel和AVX512例如Zen 4计算机来说,这些改进最为显著。
微博蚁工厂
媒体观察
普林斯顿首个“开源AI程序员”登场
普林斯顿团队祭出了全新的智能体-计算机接口ACISWE-agent。简单来说,SWE-agent能够让大语言模型比如GPT-4变身为软件工程AI智能体,并在真实的GitHub仓库里自己修bug。 SWE-agent完全开源。仅仅十几个小时,就在GitHub上斩获了1.6k星,109个Fork。
新智元
西安博士做软件,年入170亿
3月末,陈宇红掌舵的中软国际,交出成绩单。过去一年,该公司实现营收171.2亿元,同比下降14.4%净利润约7.1亿元。减收减利,公司解释,业绩受外部因素影响,正推动管理变革。2023年下半年,有企稳迹象,收入和利润小幅上升。 眼下,这家信创龙头,市值仅剩137亿港元,相较2021年8月的巅峰时期,缩水六成。其核心筹码,是继续all in华为。 “老大哥”持续收复失地,重新启动增长追随者中软,期望跟着吃肉喝汤。
21世纪商业评论
中国大部分模型都是“套壳”,算力也被“卡脖子”
“目前很多国外的模型是开源的,那么在开源的基础上进行套壳就可以形成一个套壳的大模型,接着再将一些这样的大模型拼装在一起就变成更大的大模型,这种方式做出来的大模型背后的原创性是有限的。另外,我们算力也被“卡脖子”,比如英伟达的GPU A100和H100被美国禁售,很多公司受到影响。”薛澜表示,此外,中国数据质量比较低,没有真正产业化,相对标准化的数据服务商还比较少,而且中国资本短视等,都是中国大模型产业下一步发展需要思考和解决的问题。
钛媒体
英伟达A800租赁价低至2元每小时
近日,在某社交平台用户发帖称,市场价格超10万元的英伟达A800人工智能训卡,在某平台租赁价格仅需2元/时,引发关注。据帖文称,按调试训练一个大模型平均要1个月计算,每月2元/时租赁A800训练成本单卡仅需不到1440元,该价格仅为购买A800这款AI显卡价格的1/69,并且无需承担运营数据中心、电费等成本。
多家算力租赁行业企业人士表示,今年一季度算力租赁供需仍然紧张。另有业内人士分析称,算力租赁市场供需结构正在逐步调整,对于有AI计算需求的中小企业及研究机构来说,成本投入将得到改善。
科创板日报
加快全国一体化算力网和数据流通基础设施建设
4月1日,2024年全国数据工作会议在北京召开。这是国家数据局正式挂牌后的首次全国数据工作会议。会议指出,2024年数据工作要优化数据基础设施布局。加快全国一体化算力网和数据流通基础设施建设,发挥好政府投资的放大效应。
算力是支撑数字经济发展的关键基础设施。2024年《政府工作报告》提出,适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。
证券日报
今日推荐
开源项目
loxilb-io/loxilb
https://github.com/loxilb-io/loxilb LoxiLB 是一种开源云原生 “external” 服务负载均衡器,用于使用 eBPF 作为其核心引擎并基于 Go 语言从头开始编写的云原生 5G/Edge工作负载。 LoxiLB 将 5G/Edge 服务的 Kubernetes 网络负载均衡转变为高速、灵活和可编程的 LB 服务。它将外部负载均衡器的管理任务自动化部署、启动、配置、供应、扩展、升级、迁移、路由、监控和资源管理。虽然,它主要被设计为支持裸机内部和边缘集群的部署,但它在任何云环境中都应该同样运行良好。 推荐理由 LoxiLB是一个创新的开源负载均衡器,专为云原生环境设计,尤其是Kubernetes。它利用先进的eBPF技术,提供卓越的性能和灵活性。LoxiLB支持多种服务类型,包括L4/NAT状态负载均衡和L7代理,以及GTP隧道支持,满足不同网络需求。它的兼容性广泛,能与各种Kubernetes发行版和CNI无缝集成。LoxiLB的高性能、低延迟和高吞吐量,使其成为需要高性能和高可扩展性负载均衡解决方案的理想选择。无论是公共云、本地环境还是独立环境,LoxiLB都能提供出色的网络服务。
每日一博
何时应用 RAG 与微调
充分发挥 LLM 的潜力需要在检索增强生成RAG和微调之间选择正确的技术。让我们来看看何时对 LLM、较小的模型和预训练模型使用 RAG 与微调。我们将介绍
LLM 和 RAG 的简要背景
RAG 相对于微调 LLM 的优势
何时针对不同模型大小对 RAG 进行微调
对预训练模型使用 RAG 和微调
RAG 和微调的金融服务示例
实际考虑和建议
事件点评
某开源公司实习生上班时间向其他开源项目提交 PR,CEO 发现后要求关闭
夜莺监控 (Nightingale) 是一款开源云原生监控工具,由滴滴开发和开源,并于 2022 年 5 月 11 日捐赠予中国计算机学会开源发展委员会CCF ODC,为 CCF ODC 成立后接受捐赠的第一个开源项目。 近日,网友发现夜莺 GitHub 仓库某个 PR 被要求关闭,原因是该 PR 由某开源公司的实习生在上班时间提交。 该公司 CEO 回复称,根据实习生签署的知识产权协议,此 PR 的知识产权属于公司,而非个人,并提出关闭这个 PR。
点评 这起实习生在工作时间向开源项目提交 PR 的事件,不仅引发了关于知识产权和员工贡献的讨论,也揭示了开源社区与公司政策之间的紧张关系。虽然公司对员工工作时间的管理是可以理解的,但事件的处理方式引起了社区的关注。这提醒我们,在鼓励个人贡献的同时,也需要平衡公司的利益和法律框架。 此事件对于理解开源社区中的复杂关系具有重要意义,可能会影响未来公司对员工参与开源项目的态度和政策。总体来说,这是一个反映开源文化与现代企业政策冲突的案例,突显了在维护开源精神的同时,也需要合理处理公司与个人贡献者之间的关系。
七大开源基金会联合制定符合 CRA 法案的共同标准
Apache 软件基金会、Blender 基金会、Eclipse 基金会、OpenSSL 软件基金会、PHP 基金会、Python 软件基金会和Rust 基金会正在联合,为欧洲议会上个月通过的《欧洲网络弹性法案》(CRA) 制定通用规范和标准。 这项工作由 Eclipse 基金会牵头,旨在建立基于现有开源最佳实践的安全软件开发通用规范。“该工作组的成立是为了解决开源生态系统中网络安全的多方面挑战,并表明我们对与 CRA 合作和实施的承诺。”
点评 这一事件标志着开源社区在网络安全方面的重要进步。有助于确保开源软件的安全性,同时也促进了开源社区与立法机构之间的合作。此外,制定统一的安全标准有助于提高开源项目的可信度和采用率,特别是在对安全性要求较高的领域。最终,这一行动可能会对全球软件开发和开源社区的治理产生深远影响,推动整个行业朝着更安全、更协调的方向发展。
近万台龙芯 3A5000 电脑走进中小学课堂
据 “龙芯中科” 官方公众号介绍,近日鹤壁市政府携手市教育局等部门,将近万台龙芯 3A5000 电脑引进鹤壁市直及鹤壁市淇滨区近 50 所中小学课堂。 这些电脑均采用基于自主龙架构的龙芯 3A5000 处理器,搭载国产 UOS 操作系统,安装 WPS 办公软件、极域教学运维管理软件等全套正版授权软件,并打通了从教室管理到教学、编程、国家 / 省市级管理平台等共 104 款应用。
点评 这一举措不仅体现了对国产技术和自主创新的重视,也为中小学教育提供了更先进的技术支持。标志着国产处理器在教育领域的应用迈出了重要一步,对推动国内技术发展和培养新一代技术人才具有重要意义。同时,这也是推动国产操作系统和软件生态发展的一个积极信号,有助于提升国内软件产业的自给自足能力。
开源之声
媒体观点
Kris马斯克大战奥特曼,竟然是个硅谷宗教故事?
《三体》里讲了,如果整个人类世界都是偶然的幸运,我们还能指望靠这种幸运走多远?马斯克们认为,如果穷途末路必然到来,我们只能全员押宝在科技上,借助它完成自我演化,朝美丽新世界勇往直前,决不能止步,因为停滞就是自绝于未来。其实马斯克也好,奥特曼也罢,甚至他们的各路朋友和对手们,大家真正的分歧在于,谁是真先知,谁是伪先知,谁有资格引领人类,走向遥远的应许之地?答案不言而喻,就是第一个把AGI做出来,向世界展示神迹的人。
观察者网
吴恩达最新演讲AI Agent工作流的未来
吴恩达分享了其对AI agent的未来发展潜力的展望。在他看来,通过代理工作流程,人工智能能够胜任的任务种类今年将会大幅扩展。此外,快速 token 生成也很重要,即使使用质量略低但速度更快的语言模型,通过更多轮次的迭代,也可能比使用更高质量但速度较慢的模型获得更好的结果。
乌鸦智能说
挖来Safari首席设计师,这款“AI浏览器”想搞次革命
就目前来说,AI搜索从技术原理上依然摆脱不了传统搜索引擎,想取代传统搜索还为时尚早。 当然从长远角度来看,随着大模型体量越来越大,处理信息的能力也会逐渐加强,AI搜索的准确性也会得到显著提升。 Arc自然也明白这个道理,在解决了用户的易用性后,下一步就是尝试改变用户的交互习惯。 而此次挖来的Safari首席设计师Charlie Deets,就曾在通信软件领域创造了”滑动”这一模式,推动了苹果乃至智能手机的一大交互习惯。 那么Arc是否能打响AI浏览器的概念,还是说成为下一个Safari,就看赌注是否能赌赢了。
镁客网
出海新兵中国AI
AI出海企业,从0到1,从1到10,再从10到100,其实对应了三个不同的阶段。 从0到1看中的其实是执行力。从1到10,则是需要go to market,围绕商业化做更多的设计和思考。当然,从更长期来看,从10到100,AI出海依旧会遇到所有中国出海企业所面临的相同问题即组织和人才的本土化。 从这一点来说,微观来看,目前中国AI出海企业只是跨越从0到1的阶段,更多的还是在寻找从1到10的方式,提升自己的获客能力和工程化能力。 而将视野放置未来,尽管当前AI应用火热,但始终没有一家独大,而中国AI集体卷向海外释放了一个更积极的信号在这轮科技竞逐中,中国创业者已经站在了牌桌之上。
硅基研究室
用户观点
用Vue全家桶纯手工搓了一个开源版抖音
观点 1体验了一下,真牛 观点 2宅男改变世界 观点 3这真是重构优化到极致了 观点 4太吊了,不知道的还以为源码泄露 观点 5,这个模板开源很多小网站可以直接套用了
某开源公司实习生上班时间向其他开源项目提交 PR,CEO 发现后要求关闭
观点 1这 CEO 格局也太小了 不少开发者同时维护多个开源项目 互相做贡献很正常 观点 2那不对,如果这个项目公司有用或者未来会用到可以理解,否则是不允许的。
MariaDB 11.4 将作为 LTS 版本发布
观点 1早些年提交了一个致命bug,倒腾来倒腾去,没法重现,被删了。。。感觉不太行啊,mairadb这节奏 观点 2这东西已经凉凉了,没啥好关注的了
伟大的开发者,你们过得开心吗?
观点一生奉献给自己所爱的事业,不管风吹雨打,岁月沧桑,几十年如故,一生如故。 那大概就是人世间最开心的事情吧,毕竟谁又能一辈子都在做自己所爱的事情呢? vim作者bram离世前三天还在commit代码。一想到这儿,我不禁潸然泪下
程序员梗图
今天的开发者们
—END—
每日一言
""世界上本没有鸡汤,鸡死了,便做成了鸡汤。""