百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

一周涨 15k Star 的开源项目「GitHub 热点速览」

ztj100 2024-11-17 04:05 19 浏览 0 评论

你训练大语言模型(LLM)用的什么框架?有没有想过不用框架训练 GPT-2?

GitHub 上就有这么一位大神(Andrej Karpathy),他仅用大约 1k 行的 C 代码就完成了 GPT-2 模型的训练,代码纯手撸、不依赖任何机器学习框架,作者这么做仅仅是觉得很有趣。尽管这个项目(llm.c)的教学意义大于实用价值,但开源一周便收获了 15k Star,可见大家对他技术的认可和惊叹。

目光回到本周其他的开源热搜项目,在线的数据库设计工具 DrawDB 和程序员专属的在线工具集合 it-tools,它们方便快捷、点开就能用。Spring 框架也想要赶上 AI 潮流,推出了帮助开发 AI 应用的 Spring 框架 spring-ai,旨在简化开发 AI 应用的复杂度。开源的托管网站平台 Coolify,让你通过点点就能部署在线服务。看来不管是硬核的手撸框架,还是提供便利的工具,在 GitHub 上都是很受欢迎的。

1. 开源新闻

1.1 Andrej Karpathy 的开源项目

上面说的 llm.c 项目(github.com/karpathy/llm.c)作者 Andrej Karpathy,他博士就读于斯坦福大学,曾就职于特斯拉的自动驾驶部门负责人、OpenAI 的创始成员。

Andrej Karpathy 热衷于深度神经网络和开源,在 GitHub 上有 71k 的粉丝。他的另外一个开源项目 nanoGPT,也是 GitHub 热榜(Trending)的常客。

nanoGPT 是用于训练/微调中等规模 GPT 模型的库。它是对 minGPT 的重写,这次的重点是速度和效率而不是教育性,值得一提的是 minGPT 的作者也是 Andrej Karpathy。

GitHub 地址:github.com/karpathy/nanoGPT

2. 开源热搜项目

2.1 在线的数据库设计工具:DrawDB

主语言:JavaScriptStar:4.7k周增长:3.8k

这个开源项目是一个免费、简单、强大的数据库实体关系(DBER)在线编辑器,无需注册即可直接在浏览器中使用。它提供了直观、可视化的操作界面,用户通过点击即可构建数据库表和导出建表语句,还可以导入建表语句,实现可视化编辑、错误检查等。支持 MySQL、PostgreSQL、SQLite、MariaDB、SQL Server 共 5 种常用的关系数据库。

GitHub 地址→github.com/drawdb-io/drawdb

2.2 帮助开发 AI 应用的 Spring 框架:spring-ai

主语言:JavaStar:1.7k周增长:300

这是由 Spring 官方开源的用于简化包含 AI 功能的应用开发的 Java 框架,它可以轻松接入 OpenAI、Microsoft、Amazon、Google 和 Huggingface 等主流模型供应商,以及聊天、文本生成图像的模型类型,支持提示工程、AI 模型转 POJO 对象、矢量数据库、RAG(检索增强生成)等有助于开发 AI 应用的功能。

GitHub 地址→github.com/spring-projects/spring-ai

2.3 轻松托管网站和服务的开源平台:Coolify

主语言:PHPStar:13k周增长:800

这是一个免费、自托管、可替代 Heroku / Netlify / Vercel 等平台的开源项目,它提供了一个 Web 平台,用户可以在上面管理、部署各种 Web 应用和数据库服务,比如多种编程语言的动态网站、静态网页、WordPress、MongoDB、Redis 等。不挑服务器可以是自己的服务器,也可以是任意云服务器,只要支持 SSH 连接即可,服务器最低配置仅需 2C2G 即可。

GitHub 地址→github.com/coollabsio/coolify

2.4 程序员的在线工具集合:it-tools

主语言:VueStar:9.9k周增长:500

该项目采用 Vue.js(Vue 3)和 Naive UI 组件库开发,汇集了对开发人员和 IT 从业者有用的工具。它免费、界面清爽、功能丰富,支持包括中文在内的多国语言,提供了加密、转化器、网络、文本等开发常用工具。

GitHub 地址→github.com/CorentinTh/it-tools

2.5 构建你的第二大脑:Quivr

主语言:TypeScript、PythonStar:31k周增长:300

该项目利用生成式 AI 的能力,成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它,之后再和它对话时,它会学习你上传的内容后回答你的问题,支持接入多种 LLM 和 Docker 一键部署。

GitHub 地址→github.com/QuivrHQ/quivr

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1面向所有开发者的学习路线图:developer-roadmap

主语言:Other

这是一份包含后端、前端、运维部署等方向的学习路径图,提供了全面、实用、交互式的学习指南,解决开发者面临技术选型困难、自学路径不明晰等痛点。

项目详情→hellogithub.com/repository/50587cd6e95e4fb0b3c787104028e9d2

3.2 假装很忙的摸鱼神器:genact

主语言:Rust

该项目可以在终端上模拟一些很忙的假象,比如编译、扫描、下载等。这些操作都是假的,实际上什么都没有发生,所以不会影响你的电脑,适用于 Windows、Linux、macOS 操作系统。

项目详情→hellogithub.com/repository/6a78a0168ffc4a9f931b0ac1983aea9f

4. 结尾

无论是崇拜大神们的技术造诣,还是探索开源世界中的新奇工具,都希望大家可以从中获得启发和收获。如果看完这些还不过瘾,可以通过阅读往期回顾的内容,找到更多热门开源项目。

往期回顾

以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。

- END -

相关推荐

再说圆的面积-蒙特卡洛(蒙特卡洛方法求圆周率的matlab程序)

在微积分-圆的面积和周长(1)介绍微积分方法求解圆的面积,本文使用蒙特卡洛方法求解圆面积。...

python编程:如何使用python代码绘制出哪些常见的机器学习图像?

专栏推荐...

python创建分类器小结(pytorch分类数据集创建)

简介:分类是指利用数据的特性将其分成若干类型的过程。监督学习分类器就是用带标记的训练数据建立一个模型,然后对未知数据进行分类。...

matplotlib——绘制散点图(matplotlib散点图颜色和图例)

绘制散点图不同条件(维度)之间的内在关联关系观察数据的离散聚合程度...

python实现实时绘制数据(python如何绘制)

方法一importmatplotlib.pyplotaspltimportnumpyasnpimporttimefrommathimport*plt.ion()#...

简单学Python——matplotlib库3——绘制散点图

前面我们学习了用matplotlib绘制折线图,今天我们学习绘制散点图。其实简单的散点图与折线图的语法基本相同,只是作图函数由plot()变成了scatter()。下面就绘制一个散点图:import...

数据分析-相关性分析可视化(相关性分析数据处理)

前面介绍了相关性分析的原理、流程和常用的皮尔逊相关系数和斯皮尔曼相关系数,具体可以参考...

免费Python机器学习课程一:线性回归算法

学习线性回归的概念并从头开始在python中开发完整的线性回归算法最基本的机器学习算法必须是具有单个变量的线性回归算法。如今,可用的高级机器学习算法,库和技术如此之多,以至于线性回归似乎并不重要。但是...

用Python进行机器学习(2)之逻辑回归

前面介绍了线性回归,本次介绍的是逻辑回归。逻辑回归虽然名字里面带有“回归”两个字,但是它是一种分类算法,通常用于解决二分类问题,比如某个邮件是否是广告邮件,比如某个评价是否为正向的评价。逻辑回归也可以...

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂

一、拟合和回归的区别拟合...

推荐2个十分好用的pandas数据探索分析神器

作者:俊欣来源:关于数据分析与可视化...

向量数据库:解锁大模型记忆的关键!选型指南+实战案例全解析

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...

用Python进行机器学习(11)-主成分分析PCA

我们在机器学习中有时候需要处理很多个参数,但是这些参数有时候彼此之间是有着各种关系的,这个时候我们就会想:是否可以找到一种方式来降低参数的个数呢?这就是今天我们要介绍的主成分分析,英文是Princip...

神经网络基础深度解析:从感知机到反向传播

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...

Python实现基于机器学习的RFM模型

CDA数据分析师出品作者:CDALevelⅠ持证人岗位:数据分析师行业:大数据...

取消回复欢迎 发表评论: