Starrydivinesky
精选了10K+项目,包括机器学习、深度学习、NLP、GNN、推荐系统、生物医药、机器视觉、前后端开发等内容。Selected more than 10k+ projects, including machine learning, deep learning, NLP, GNN, recommendation system, biomedicine, machine vision, etc. Let more excellent projects be discovered by people. Continue to update! Welcome to star!
Installation
npx starrydivineskyAsk AI about Starrydivinesky
Powered by Claude · Grounded in docs
I know everything about Starrydivinesky. Ask me about installation, configuration, usage, or troubleshooting.
0/500
Reviews
Documentation
StarryDivineSky
精选了10K+项目,包括机器学习、深度学习、NLP、GNN、推荐系统、生物医药、机器视觉等内容。
Selected more than 10K projects, including machine learning, deep learning, NLP, GNN, recommendation system, biomedicine, machine vision, etc.
让更多优秀的项目被人发现,让更多的人感受开源的魅力。
Let more excellent projects be discovered by people, let more people feel the charm of open source.
持续更新!欢迎🌟star!😀😀😀 Continue to update! Welcome to star! 😀😀😀
目录
- 机器学习与深度学习
- NLP自然语言处理
- 网络与前后端开发
- 机器视觉
- 语音识别与合成
- 推荐系统
- 因果推断
- 金融股票与时间序列
- 强化学习
- 生物医药
- 图数据库 图算法
- 图神经网络GNN
- 大数据
- 虚拟化
- 安全与渗透
- 硬件
- 其他项目
Tips 注意
- README 文件仅展示了仅两个月新增的前256个git项目。The README file only shows the first 256 git projects added in just 2 month.
- 完整的项目内容较长,建议clone后阅读或搜索。The file content is long, it is recommended to read or search after cloning.
Star🌟数变化
加入社区
A01_机器学习与深度学习
A01_机器学习教程
-
Nyandwi/machine_learning_complete 该仓库是一个全面的机器学习资源,包含30多个Jupyter笔记本,每个笔记都以通俗易懂的方式介绍不同概念、算法与技术。内容涵盖从基础理论(线性回归、逻辑回归、支持向量机等)到高级方法(深度神经网络、卷积神经网、递归神经网以及强化学习),每个主题都配有完整代码示例,展示数据加载、预处理、模型训练与评估流程。笔记中还提供常用的交叉验证、超参数调优及性能指标计算工具,让使用者能快速搭建并优化机器学习管道。此外仓库支持多种Python包(NumPy、Pandas、Scikit-learn、TensorFlow、PyTorch),并给出简易安装步骤与环境配置,方便在本地或云端运行。
-
r0f1/datascience r0f1/datascience 是一个在线资源库,提供精选的 Python 资源,专为数据科学量身定制;它旨在通过在一个易于访问的位置聚合高质量的教程、文档和参考资料来简化学习;每个条目都包含简洁的描述和指向官方或社区网站的直接链接,例如 NumPy、pandas、scikit-learn、matplotlib、seaborn、TensorFlow、PyTorch、Jupyter Notebook 等;该资源库按“核心库”、“可视化工具”、“机器学习框架”、“深度学习平台”和“数据处理与分析”等类别进行组织;用户可以按“回归”、“分类”、“聚类”、“神经网络”、“统计推断”等子主题或按特定库名称浏览资源;它提供常见任务的代码片段,以说明每个库在实际数据科学工作流程中的典型用法;其他内容包括最佳实践、推荐阅读顺序以及来自 Coursera、edX、DataCamp、Kaggle Notebooks 等平台的免费在线课程链接;所有资源都会定期更新,以反映新版本、弃用或重大改进,确保列表对从业者和学生都保持最新;该存储库使用 GitHub Markdown 文件,方便社区贡献者进行导航、版本控制和协作;用户可以克隆到本地并打开 ContentFile(path="README.md"),其中包含每个类别的完整概述以及它们在典型数据科学项目中的相互联系;通过提供“先阅读文档”、“尝试内置示例”、“应用于小型数据集”等明确的工作原则,该列表可以帮助用户避免在学习新的 Python 工具时常见的陷阱;r0f1/datascience 项目是一个一站式中心,为任何需要可靠、最新的 Python 资源的人提供支持数据科学项目,涵盖从探索性分析到模型部署的各个阶段。
其他_机器学习与深度学习
- CannyLab/tsne-cuda CannyLab/tsne-cuda是一个基于CUDA加速的t-SNE降维算法实现项目,通过Python绑定接口实现高效的数据可视化处理。该项目专为大规模高维数据集设计,利用NVIDIA GPU的并行计算能力,将传统t-SNE算法的计算效率提升数十倍,特别适合处理包含数万甚至数十万数据点的机器学习任务。其核心工作原理是将t-SNE的梯度下降优化过程分解为多个并行计算单元,通过CUDA线程块分配每个数据点的相似性计算任务,结合共享内存优化和Barnes-Hut近似算法降低复杂度,最终在GPU上实现毫秒级的降维速度。开发者提供了完整的Python API,支持从NumPy数组直接加载数据,包含参数调优接口和可视化输出功能,用户可通过pip安装后在Jupyter Notebook或命令行中快速部署。项目还包含针对MNIST、CIFAR等标准数据集的基准测试脚本,实测显示在10,000个数据点的场景下,其速度比CPU版本快约35倍。开发者持续维护CUDA内核代码,支持NVIDIA Volta及Ampere架构显卡,同时提供详细的文档说明和GitHub讨论区,适合需要快速可视化高维数据的科研人员和工程师使用。
分布式机器学习
参数优化
异常检测
梯度提升和树模型
特征工程
神经网络结构搜索_Neural_Architecture_Search
A02_NLP自然语言处理
A01_文本生成_文本对话
其他_文本生成_文本对话
大语言对话模型及数据
Agent代理助手_机器人
-
msitarzewski/agency-agents msitarzewski/agency-agents 是一个开源的人工智能代理框架,旨在通过模块化、角色化的智能体(Agent)体系,为用户提供“开箱即用”的AI团队协作解决方案。它精准解决了传统AI工具功能单一、协作割裂的痛点,将分散的AI能力整合为具备明确分工和人格化特质的虚拟团队,从而覆盖从创意生成到实际落地的全流程需求。 该项目的核心亮点在于其高度场景化的角色设计、可组合的协作流程以及人性化的交互体验。首先,它摒弃了通用型AI的模糊定位,为每个代理(如“前端向导”“Reddit社区专家”)赋予特定职能和鲜明性格,例如“奇想注入者”负责激发创意,而“现实校验员”则确保可行性,这种设计大幅降低了用户调配AI资源的认知负担。其次,代理间可通过标准化接口无缝协作,用户能像搭积木一样自由组装工作流,例如将内容生成代理与审核代理串联,形成闭环生产链。此外,代理的“人格化”输出(如幽默语气或严谨报告)显著提升了交互自然度,远胜于机械应答的常规AI工具。 其技术架构采用**“角色-任务-工具”三层抽象模型**,类似于现实中的公司架构:每个代理如同一位专业员工,自带技能库(工具层)和标准化SOP(任务层),而用户扮演“CEO”角色,只需下达高层指令(如“运营社交媒体”),系统便会自动分解子任务并调度对应代理执行。这种设计通过动态编排(Orchestration)技术实现,类似交响乐指挥根据乐谱协调不同乐器——代理的决策逻辑由轻量级规则引擎驱动,既能保证执行效率,又保留了灵活定制的空间。项目通过清晰的API契约和示例化配置,使得非技术用户也能快速上手,而开发者则可基于Python生态深度扩展,这种平衡性使其在同类框架中脱颖而出。
-
karpathy/autoresearch karpathy/autoresearch 是一个通过 AI 智能体自动执行单 GPU 小规模语言模型(如 nanochat)训练研究的开源项目,其核心目标是解决人工调参和实验流程重复性高、效率低下的痛点,将研究者从繁琐的试错中解放出来,专注于更高阶的创新设计。 该项目的核心亮点在于其高度自动化的研究框架设计:首先,它通过智能体自主管理实验生命周期,从超参数搜索到训练验证全程无需人工干预,相比传统手动脚本或简单调度工具(如 cron)显著提升了实验迭代速度;其次,项目针对单 GPU 环境优化,使得个人开发者或资源有限的团队也能高效开展模型研究,打破了传统大规模实验对计算集群的依赖;此外,其模块化设计允许灵活扩展实验任务类型,例如支持不同架构的模型对比或数据增强策略测试,为小规模研究提供了通用化平台。 从技术原理上看,autoresearch 的运作机制类似于一位“不知疲倦的实验室助手”:智能体会根据预设的研究目标(如验证损失最小化)生成多种实验配置,像厨师尝试不同食材组合一样系统性地探索参数空间;每次训练结果会被自动记录并评估,进而反馈给智能体调整后续实验方向,形成类似“贝叶斯优化”的自我改进闭环。这种设计巧妙地将人类研究者的经验抽象为算法规则,使得单块 GPU 的计算资源能被最大化利用。 整体而言,该项目以轻量化、自动化的特色填补了小规模 AI 研究工具链的空白,尤其适合需要快速验证假设的学术场景或初创团队。其技术路径也反映出当前 AI 领域的新趋势——通过智能体降低研究门槛,让创新从计算资源的竞争中回归到算法设计本身。
-
paperclipai/paperclip Paperclip 是一个专为"零人力公司"设计的开源自动化编排工具,其核心目标是消除重复性人工操作,通过程序化流程将内容生产、分发及管理全链路自动化,尤其解决了中小团队在跨平台内容运营中效率低下、人力成本高昂的痛点。该项目以"内容即文件"(Content as Files)为理念,将复杂的多平台协作简化为对本地文件的版本控制,使非技术用户也能轻松实现企业级自动化。 核心特色上,Paperclip 展现出三重优势:其一,它通过声明式配置(如 YAML 文件)定义工作流,用户只需描述"做什么"而非"如何做",大幅降低自动化门槛;其二,内置与主流平台(如 Notion、Slack、GitHub)的深度集成,能自动同步文件变更到第三方服务,形成闭环;其三,独创的"内容指纹"技术可智能识别文件变更类型(如文本更新、图片替换),仅触发必要的下游操作,相比传统轮询方案节省 90% 以上的计算资源。 技术原理可类比为"智能文件管家系统":当用户修改本地 Markdown 或图片文件时,Paperclip 像一位经验丰富的图书管理员,不仅会记录文件差异(类似 Git 的版本控制),还能根据文件类型自动执行预设动作——例如将更新后的博客草稿发布到 CMS,或把修改后的产品截图同步给设计团队。其底层通过轻量级文件监听服务(基于 Rust 的 notify 库)实现毫秒级响应,结合规则引擎判断触发条件,而开放式的插件架构允许用户用 Python 或 JavaScript 扩展自定义逻辑。这种设计使得系统既能处理"上传新 PDF 到客户门户"这类简单任务,也能完成"抓取网页数据→生成报告→邮件发送"的复杂流水线。 整体来看,Paperclip 重新定义了人机协作的边界,它既保留了开发者喜爱的代码级控制力,又通过抽象化封装让市场、运营等角色获得"所见即所得"的自动化能力。这种平衡性使其在开源自动化工具中独树一帜,尤其适合需要频繁处理跨平台内容但缺乏专职 DevOps 团队的场景。
-
badlogic/pi-mono badlogic/pi-mono 是一个专为开发者打造的全栈式人工智能智能体工具包,其核心价值在于彻底解决了当前 LLM 应用开发过程中面临的技术栈碎片化与工具链割裂的痛点。该项目通过构建统一的 API 抽象层,屏蔽了底层不同大模型接口的差异性,使得开发者无需重复适配即可调用多种服务,相比同类分散的工具集,它提供了极高的集成效率,避免了上下文切换带来的认知负荷;同时项目不仅支持 TUI 和 Web UI 库以灵活构建交互界面,还深度集成了 Slack Bot 与 vLLM Pods,实现了从本地终端到云端推理的无缝衔接,这种全场景覆盖的能力远超单一功能的脚本工具。在技术原理上,它如同一个通用的智能适配器,将复杂的模型调用逻辑封装为标准化的指令集,就像把不同电压的电器都转换成统一的接口插头一样,让开发者只需关注业务逻辑而非底层通信细节,从而能够专注于构建真正的智能体应用而非繁琐的工程配置,这种设计思想极大地降低了从原型验证到生产部署的迁移成本,确保团队在快速迭代中依然保持架构的稳健性,让智能体开发从技术实验转变为可持续的工程实践。
-
HKUDS/CLI-Anything CLI-Anything是一个旨在将任意软件转化为"智能体原生"(Agent-Native)工具的开源框架,其核心痛点是解决传统CLI(命令行界面)工具与AI智能体交互时的割裂问题。当前,尽管大语言模型(如ChatGPT)能生成基础命令,但复杂软件的参数组合、上下文记忆和动态反馈仍需人工介入,而CLI-Anything通过构建统一的中间层,使AI智能体能够像人类专家一样自如操作各类CLI软件,显著提升了自动化任务的可靠性和覆盖范围。 该项目的核心亮点在于其泛用性适配、动态上下文管理和低侵入式设计。首先,它通过"CLI-Hub"集中管理数百种常见工具的语法模板(如FFmpeg、Git),无需修改原软件即可实现智能体调用;其次,它能动态跟踪多步骤命令的上下文状态(例如交互式数据库查询),避免传统自动化脚本因遗漏中间状态而失败;最后,其设计允许用户通过自然语言描述任务(如"压缩视频并上传到S3"),系统会自动分解为原子命令并处理异常,比单纯依赖LLM生成命令的工具有更高的执行成功率。 从技术原理看,CLI-Anything的工作机制类似于一位"命令行翻译官"。它通过三层架构实现功能:语义解析层将用户或AI的自然语言请求转换为标准化的"意图树"(类似把"整理照片"拆解为格式转换、重命名、归档等子任务);适配器层则像多语言词典一样,将通用意图映射到具体软件的CLI语法(如ImageMagick的
convert参数);最后的执行引擎如同经验丰富的操作员,不仅按顺序执行命令,还会实时检查输出日志、处理权限错误等边缘情况。这种设计使得原本"沉默"的CLI工具具备了与智能体对话的能力,其价值类似于为机械键盘加装蓝牙模块——既保留原有高效性,又新增了无线交互的便利性。 整体而言,CLI-Anything通过巧妙的抽象层设计弥合了AI智能体与本地软件间的鸿沟,其开源特性进一步降低了企业级自动化流程的开发门槛。对于需要批量操作专业软件的场景(如影视渲染、数据清洗),该项目提供了一种比传统RPA更轻量且可解释的解决方案,未来有望成为连接LLM与实际生产力的重要桥梁。 -
qwibitai/nanoclaw nanoclaw 是一个基于容器化架构构建的轻量级智能代理执行框架,旨在解决传统自动化操作工具在安全性与多平台集成方面存在的风险过高及生态割裂痛点。该项目的核心优势在于其独特的安全隔离机制,相比同类开源方案,它通过容器技术将敏感操作限制在独立沙盒内,彻底消除了本地环境被污染的风险;同时它打破了应用间的数据孤岛,能够无缝连接 WhatsApp、Telegram 乃至 Gmail 等主流通讯协议,实现了跨平台指令的统一分发。更令人印象深刻的是,nanoclaw 直接锚定 Anthropic Agents SDK,赋予了 AI 代理持久的记忆能力与自动化调度逻辑,使其不再是单次执行的脚本而是具备长期规划能力的智能体。从技术原理来看,其运作机制可类比为一个配备独立防护服的智能办公区,AI 代理在受保护的沙盒容器中调用底层接口处理任务,就像秘书在安全隔间里同时接听电话、发送邮件并记录会议纪要,既保证了外部指令的精准触达,又通过 SDK 让每一次交互都拥有连贯的记忆上下文,从而在保障系统稳定性的前提下实现了复杂业务流程的自动化闭环。
-
K-Dense-AI/claude-scientific-skills 这是一个专为 Claude 模型设计的开源智能体技能库,旨在解决通用大语言模型在科研、工程及金融分析等专业领域缺乏深度推理能力和精准工具调用的痛点。该项目不仅仅是一个提示词集合,而是一套高度模块化的 Agent 增强方案,通过结构化的能力封装重新定义了 AI 在垂直领域的交互模式。其核心优势体现在三个维度:首先,它具备极强的领域专业性,针对科学研究和工程技术进行了专项优化,能够处理远超通用模型泛化能力的复杂逻辑任务;其次,系统采用了分层架构设计,确保了推理链条的严密性,有效减少了传统对话中常见的幻觉问题;最后,极高的集成便利性使得开发者无需从零构建工具即可快速部署专业级助手。从技术原理上看,这套系统相当于为 AI 配备了一套精密的瑞士军刀。传统的对话模型如同一个博学但缺乏具体工具的助手,面对复杂任务往往只能泛泛而谈,而本项目通过预定义的技能模块,将复杂的科学计算或逻辑分析封装成标准指令节点。当用户提出需求时,系统并非盲目生成文本,而是像指挥家调度乐手一样,自动调用对应的技能节点来处理数据或推导结论,从而在保持语言流畅性的同时实现了专业级的任务闭环。这种架构使得非技术背景的用户也能轻松获得专家级别的辅助,极大地提升了垂直领域的工作效率与准确性,是连接通用大模型与专业工作流的关键桥梁。
-
anthropics/claude-plugins-official Anthropic 官方维护的高质量 Claude 代码插件目录,旨在解决开发者因生态分散而难以快速获取可靠、经过验证的 Claude AI 插件的问题。该项目通过集中化管理精选插件,显著降低了用户筛选成本,同时确保插件与 Claude 模型的兼容性和功能性,为开发者提供了开箱即用的工具集。 核心特色 首先,其官方背书是最大亮点——Anthropic 直接参与插件的审核与维护,避免了第三方插件可能存在的兼容性风险或质量参差问题。其次,插件目录采用模块化设计,开发者可像拼装乐高积木一样自由组合功能,例如将自然语言处理插件与数据可视化工具快速集成。此外,项目强调“生产就绪性”,所有插件均附带完整的测试用例和文档,相较于社区自发维护的同类项目,其稳定性和维护响应速度更具优势。 工作原理浅析 该项目本质上是一个标准化接口的中转站。想象 Claude 模型如同一个多功能厨房,而插件则是各种厨具(如榨汁机、烤箱)。该目录的作用类似于厨具说明书库,不仅提供工具清单,还确保每件工具都配有清晰的安装指南(API 规范)和安全认证(兼容性测试)。其技术架构依赖两大支柱:一是 Anthropic 定义的统一插件协议,所有插件必须通过“插头适配器”(协议接口)与 Claude 交互;二是自动化质量关卡,通过持续集成(CI)流水线对插件进行“压力测试”,例如模拟高并发调用或异常输入,确保其鲁棒性。这种设计使得开发者无需深入底层协议,即可通过简单的配置文件(如 YAML)调用插件功能,类似于用食谱操作厨具而非从头打造工具。 整体而言,该项目通过官方治理、模块化生态和工业化标准的三重保障,为 Claude 开发者提供了高效可靠的插件解决方案,其设计思路对AI工具链的生态建设具有普适参考价值。
-
alibaba/page-agent 一款基于自然语言交互的网页图形界面(GUI)代理工具,其核心解决了非技术人员或开发者通过简单指令操控复杂网页界面的痛点。传统自动化工具需要编写代码或配置复杂规则,而该项目通过自然语言理解技术,将用户的口头或文本指令转化为对网页元素的具体操作(如点击、输入、导航等),大幅降低了网页交互的技术门槛。 核心特色 首先,其自然语言驱动的交互模式打破了技术壁垒,用户无需学习XPath或CSS选择器等专业知识,仅需描述目标操作(如“点击登录按钮”)即可完成任务。其次,项目采用动态元素定位技术,能智能适应网页结构的变动,相比传统自动化工具依赖固定元素路径的方式,显著提升了鲁棒性。第三,其轻量级设计以纯JavaScript实现,无需后端服务或浏览器插件,可直接嵌入现有网页运行,降低了部署成本。 工作原理浅析 page-agent 的工作流程类似于一位“网页操作翻译官”。当用户输入自然语言指令(如“搜索商品”)后,工具首先通过预训练的NLP模型解析指令意图,将其拆解为原子操作步骤;接着,利用浏览器内置的DOM树和视觉特征(如按钮文本、位置等)动态匹配目标元素,而非依赖易失效的静态路径。这一过程类似人类通过界面文字和布局理解功能,再通过模拟点击或键盘输入完成任务。技术栈上,项目结合了轻量级语言模型与浏览器API,在保证响应速度的同时规避了传统RPA工具对开发环境的依赖。 整体而言,page-agent 通过自然语言与网页的“双向翻译”,为客服、测试或日常办公场景提供了一种低代码的自动化方案,其设计平衡了易用性与适应性,尤其适合快速变化的现代Web应用。
-
tanweai/pua 一个面向 AI 代理(agent)开发的技能增强工具库,其核心目标是解决 AI 代理在执行任务时缺乏高能动性(high agency)的问题,即通过模块化的技能设计,赋予代理更主动、灵活的任务执行能力。传统 AI 代理往往依赖预设规则或被动响应,而 PUA 通过动态技能组合和上下文感知,使代理能够像人类一样主动调整策略,适应复杂场景。项目的核心亮点首先体现在其模块化技能设计上,开发者可以像搭积木一样自由组合技能,无需重复造轮子;其次是高可扩展性,通过轻量级接口实现技能的热插拔,适应从自动化脚本到复杂决策的多种需求;最后是上下文驱动的独特机制,技能能够根据实时环境动态调整优先级,例如在资源受限时自动降级非关键任务,这一点显著优于同类工具中常见的静态流程控制。从技术原理看,PUA 的工作逻辑类似于一个“智能技能调度中心”。它通过两层架构实现灵活控制:底层的技能引擎负责标准化技能输入输出(类似快递分拣系统),而上层的上下文管理器则像经验丰富的指挥官,综合评估当前状态(如剩余计算资源、任务紧急度)来动态分配技能资源。例如,当代理检测到用户情绪波动时,会自动触发高优先级的情感安抚技能,而暂缓执行数据备份等后台任务。这种设计使得代理既能保持目标导向,又能像人类一样“随机应变”。值得一提的是,项目文档中隐含了对 AI 代理“绩效改进计划”(PIP)的隐喻,暗示其可通过持续学习优化技能组合——正如一位被赋予高期望的工程师,PUA 要求代理在 30 天内通过实际表现证明其进化能力。这种将工程管理思维融入 AI 设计的理念,使其在自动化工具领域显得独树一帜。
-
VoltAgent/awesome-openclaw-skills VoltAgent/awesome-openclaw-skills 是一个面向 OpenClaw 社区的开源技能集合。最初它是 Clawdbot,随后改名为 Moltbot,再度改版成现在的 Awesome‑OpenClaw‑Skills,它把各种机器人能力拆解成可复用的“Skill”,并统一给出简洁 API 让开发者像调用函数一样添加新功能。核心特性包括:① 模块化设计——每个 Skill 都是独立、轻量的 Python 包;② 与 OpenClaw 核心无缝合,直接读取传感器数据并写回控制指令;③ 兼容多平台——可在 Windows/Linux/Jetson 等上编译运行。工作原理:开发者先通过
pip install awesome-openclaw-skills安装库,然后用import openclaw_skills as oc引入;接着调用如oc.navigate_to(x, y)、oc.pick_object('red')等函数,OpenClaw 底层会把命令转译成低阶驱动。项目还提供完整单元测试与示例脚本,让新人可以快速跑起 demo 并直接参予贡献。许可证采用 MIT;作者列表在 README 中列出,并欢迎 PR 与 issue 讨论。 -
agentscope-ai/CoPaw CoPaw 是由 AgentScope 团队精心打造的一款个人 AI 助手开源项目,其核心目标在于解决用户在本地部署大语言模型时普遍面临的环境配置繁琐、多平台交互割裂以及功能扩展受限的痛点。作为一个高度灵活的工具,CoPaw 不仅仅是一个简单的聊天界面,更是一个能够深度整合多种能力并适应不同硬件环境的智能中枢。首先,该项目在部署灵活性上表现卓越,它允许开发者将服务完全运行在自己的物理机器上以保障数据隐私,同时也支持云端弹性部署以获得更强算力,这种双重选择有效解决了传统方案中隐私安全与计算资源不可兼得的矛盾。其次,CoPaw 打破了应用间的孤岛效应,原生支持连接多个主流聊天应用程序,用户无需在微信、Telegram 等不同平台间反复切换,所有交互均汇聚于统一的核心逻辑中,极大地提升了多任务处理的连贯性与效率。最后,其架构设计强调极高的可扩展性,开发者可以通过简单的接口注入新的功能模块,这使得 CoPaw 能够随着 AI 技术的演进不断进化,而无需像传统闭源工具那样受限于固定的功能列表,始终保持着适应新场景的活力。在技术原理层面,CoPaw 的工作机制可以被形象地理解为一个智能的中央调度站或是一位经验丰富的管家。当用户发出指令时,系统并不会盲目执行,而是先通过核心逻辑层精准理解意图,然后从后台众多的“工具箱”中动态调用最合适的工具来完成任务。其底层架构采用模块化设计,核心逻辑与具体功能相互解耦,这就像智能手机操作系统允许用户自由安装应用一样,CoPaw 允许开发者通过标准化的接口定义新的能力,系统会自动识别并无缝整合这些新模块。这种设计确保了即使面对复杂的任务流程,系统也能保持清晰的运行路径,将原本繁琐的本地化部署过程简化为一条逻辑清晰的链条,让具备基础知识的普通用户也能轻松驾驭强大的 AI 技术,真正实现了人工智能从复杂工具到个人助手的平滑过渡。
-
VoltAgent/awesome-agent-skills 一个聚焦于AI智能体(Agent)技能生态的开源知识库,它系统性地解决了开发者面临的多模态AI工具技能分散、适配标准不统一的核心痛点。通过聚合官方开发团队与社区贡献的1000+智能体技能指令,该项目构建了一个跨平台兼容的"技能超市",支持Codex、Antigravity、Gemini CLI等主流AI开发环境,显著降低了开发者探索和集成AI能力的门槛。该项目的核心特色首先体现在其标准化技能架构上,所有技能均采用类似"烹饪食谱"的模块化描述方式,将复杂AI能力拆解为可组合的步骤化指令,这种设计使得不同技术背景的开发者都能快速理解调用逻辑。其次,其动态兼容层技术尤为亮眼,通过类似"翻译官"的中间件机制,自动将通用技能指令转换为特定AI工具(如Cursor编辑器)的本地化API调用,避免了重复开发带来的资源浪费。更值得一提的是其社区驱动机制,采用"维基百科式"的协作模式,每个技能条目都附带真实场景的测试案例和性能指标,这种透明度远超同类静态文档项目。从技术实现看,项目底层采用了一种巧妙的技能描述语言(SDL),其工作原理类似于乐高积木的拼接系统:开发者通过标准化标签(如#文件操作/#数学计算)声明技能类别,系统会根据目标平台的API特性自动匹配最优实现方案。例如当用户调用"PDF解析"技能时,SDL引擎会先检测当前环境是否安装Antigravity,若无则自动降级为Gemini CLI的基础文本提取模式。这种设计通过"能力探测→动态适配"的两阶段处理,实现了类似智能手机APP在不同分辨率屏幕上自动适配的效果。项目还创新性地引入了技能有效性验证链,每次社区提交新技能时,会触发自动化测试流水线模拟真实调用场景,确保技能描述的准确性如同经受过"沙盘推演"的军事战术般可靠。 整体而言,该项目正在成长为AI智能体领域的"标准技能词典",其价值不仅在于现有资源的整合,更在于建立了一套可持续进化的技能共享协议。随着Claude等新一代模型对复杂技能链调用需求的增长,这类标准化、可验证的技能库将成为连接AI潜力与实际应用的关键基础设施。
-
THU-MAIC/OpenMAIC OpenMAIC(Open Multi-Agent Interactive Classroom)是一个基于多智能体交互技术的开源教学平台,它通过模拟真实课堂中的师生互动与协作学习场景,解决了传统在线教育中缺乏动态个性化反馈和沉浸式参与感的痛点。该项目由清华大学机器学习与人工智能课程团队开发,将大语言模型(LLM)驱动的智能体转化为虚拟教师、助教和学生角色,使学习者能在高度拟真的数字化环境中获得"一对一导师"式的自适应学习体验。 该项目的核心特色首先体现在其多角色协同的架构设计上。与单智能体答疑系统不同,OpenMAIC构建了包含教师、解题专家、评分员等专业分工的智能体矩阵,这种设计类似于手术团队中的主刀医生、麻醉师和护士各司其职,能针对学习者的错误答案进行多角度诊断和分步骤引导。其次,其交互协议支持智能体间的动态协商机制,当虚拟教师无法解答问题时,系统会自动触发专家智能体接替,这种故障转移能力显著优于传统智能辅导系统的单点失效缺陷。最独特的是其情境记忆功能,通过持久化存储对话历史,使智能体像人类教师一样记得学生的知识盲点,在后续互动中主动强化薄弱环节。 从技术实现来看,OpenMAIC采用了一种类似"议会辩论"的决策机制。当用户提出问题时,教师智能体首先作为"议长"协调讨论,解题智能体扮演"专业议员"提供分论点,评分智能体则像"评审团"验证解答质量,整个过程通过精心设计的提示词(prompt engineering)确保输出符合教学逻辑。系统底层采用轻量化设计,既支持云端部署也能在消费级GPU上运行,其模块化架构允许教育机构像搭积木一样替换特定功能的智能体。这种设计使得平台既能保持类似MOOC的易用性,又具备了私教课才有的深度交互能力,为AI教育普惠化提供了可复用的技术范本。
-
OthmanAdi/planning-with-files OthmanAdi/planning-with-files项目以 “文件为中心” 的思路,提供了一套完整的持久化 Markdown 规划工具。核心目标是让团队在日常工作中,通过最直观、最易用的文本编辑器来完成任务管理、进度跟踪以及决策记录,而不必依赖复杂的数据库或专业软件。项目采用了类似 Manus 的“文件为状态”模式:每一次对规划文档的修改,都会在本地生成对应的 JSON 状态快照,并自动写入同一目录下的
state.json文件中,从而实现真正意义上的持久化。 1. 工作原理 - 文件层级结构:** 规划以 Markdown 语法为主干,所有子任务、里程碑等都被拆分成独立.md子文件。每个子文件会在目录树中对应一条 “父级” 的引用链接,形成清晰的树状视图。 - 状态快照:** 当你打开主文档README.md并进行编辑时,项目内部会自动读取并解析所有.md子文件,将它们的内容、修改时间以及自定义属性(如status: done)写入state.json。该 JSON 文件可被任何工具读取或导出为 CSV/Excel 等格式,实现跨平台共享与同步。 - 工作流:在完成一次迭代后,只需保存文档,所有子文件的更新会立即反映到状态快照中;若要回溯历史,则直接通过git log或本地时间戳即可定位。 2. 项目特色与功能点 - 支持 双向同步:Markdown 文档编辑 → state.json 更新;state.json 变更(如手动修改)→ Markdown 自动更新。 - 易读写入:所有文件均为纯文本,任何常用的代码编辑器或 IDE 均可直接打开,无需额外插件。 - 透明的工作日志:每次改动会在state.json的 “history” 节点记录时间戳、作者以及差异内容;通过命令行工具可快速生成“最近十条更新”的摘要,便于会议回顾。 - 适用于大型并购案例(如 $2B 并购):在并购过程中往往需要追踪项目交接点与里程碑。该项目把每一个 “里程碑” 以子文件的方式保存,并通过state.json自动生成进度表格,团队可直接将其嵌入到交易报告中,省却手工编制 PPT 的时间。 3. 使用示例 - 克隆仓库:git clone https://github.com/OthmanAdi/planning-with-files.git。 - 在项目根目录下创建tasks/文件夹,并在其中放置子文件如init.md,design.md,delivery.md等。 - 运行命令planning-with-files generate --project tasks,程序会扫描所有.md子文件并生成对应的state.json与一个progress_table.xlsx的进度表格。 - 每次打开主文档README.md并编辑时,只需按 Ctrl+S(或 Command+S)即可触发自动更新,团队成员只要在各自电脑上打开同一文件,即可看到最新状态。 4. 技术实现与部署 - 采用 Node.js + TypeScript 开发,利用fs模块读取/写入本地文件。 - 使用 marked 库解析 Markdown 并提取自定义属性。 - 项目包含一个简易的 CLI 工具:planning-with-files generate --project <folder>;也可直接通过 VSCode 插件方式启动,插件会在侧边栏中展示实时进度表格。 5. 扩展与社区 - 你可以把state.json导入任何 BI 或报表工具(如 PowerBI、Tableau)进行更高级的数据可视化。 - 项目已在 GitHub Actions 中预置 CI,确保每一次 push 都能自动生成最新的进度表格并推送到 GitHub Pages 做公开展示。总结来说,该项目把 Markdown 文档和文件系统这两大简单概念融合,在工作模式上实现了真正意义上的 “持久化规划”。无论你是小团队还是跨国的大型并购,使用planning-with-files都能让任务管理、进度追踪与决策记录变得轻松直观,并且可以随时通过任何文本编辑器或 IDE 直接查看。其高度透明的文件结构和状态快照,也为后续审计、报表提供了极佳的数据源,真正成为团队内部 “规划无痛点” 的利器。 -
nearai/ironclaw IronClaw 是一款基于本地主权与安全优先理念构建的开源 AI 助手框架,其核心旨在解决当前主流 AI 服务中数据不透明、供应商锁定与隐私泄露的痛点,尤其针对需要在高敏感环境中安全调用大模型能力的个人开发者与企业团队。它通过“数据本地化+能力沙箱化”的架构设计,将 AI 的执行边界严格限制在用户可控范围内,彻底切断云端遥测与隐性数据收集。该项目有三大核心亮点:其一,纵深防御的安全基座,采用 WASM 能力沙箱与端点白名单机制,配合密钥边界注入与提示注入实时清洗,从执行层到交互层构建零信任防线,确保“即使 AI 被恶意引导,也无法越权访问核心数据”;其二,自主演化的无锁工具链,支持通过自然语言描述动态生成 WASM 工具,并原生兼容 MCP 协议与热插拔插件架构,打破传统 AI 助手“等厂商更新”的被动模式,实现能力按需生长;其三,持久记忆与全场景流转,融合全文与向量检索的 RRF 算法搭配工作空间文件系统,结合 Cron 调度、心跳自修复与多端并发网关,让 AI 不仅“记住你”,还能在后台稳定、并行地处理复杂工作流。其工作原理可通过“带装甲的私人数字工坊”类比理解:用户的数据与偏好如同工坊的核心档案库,被严格锁在本地(加密存储与身份文件);AI 模型是工坊的“主理人”,负责统筹任务;而每一个外部请求或工具调用,都必须进入独立的 WASM 隔离工作台执行。主理人通过严格的门禁系统(凭据保护与端点白名单)发放临时通行证,工作台仅拥有完成当前任务所需的最小权限。任何违规操作或提示注入尝试,都会被工坊的“安保协议”即时拦截并清理。技术实现上,它依托基于能力的权限模型(Capability-based ACL)隔离 WASM 模块运行上下文,通过宿主边界密钥注入机制杜绝凭据泄露;记忆层采用倒数排名融合(RRF)算法桥接传统全文索引与向量数据库,实现高召回率的混合检索;调度层则基于事件驱动架构集成 Cron 定时、Webhook 触发与并行上下文隔离,配合 Docker 编排与自修复探针保障长时任务的鲁棒性。IronClaw 的独特之处在于将企业级零信任架构与 AI Agent 工作流深度融合,并将其轻量化、本地化。它直击当前 AI 应用中“功能越强,风险越高”的信任危机,通过可审计的开源代码与模块化设计,在绝对数据主权与强大自动化能力之间取得平衡。无论是追求隐私的个人用户、需要定制化工具链的开发者,还是处理敏感业务的企业团队,IronClaw 都提供了一个无需妥协的 AI 协作基座。
-
HKUDS/DeepTutor DeepTutor 是一款人工智能驱动的学习助手,能够根据每位学生的需求调整学习内容。它通过分析学生的个人表现和偏好,提供个性化的学习计划。该系统构建知识图谱,映射数学、物理、化学、生物等学科中的概念及其相互关系。一个基于 Transformer 的先进模型会根据学生的先决条件和学习差距,预测最适合他们的下一个学习主题。学生的答案会被自动解析;DeepTutor 会评估答案的正确性,并以自然语言或针对性提示提供即时反馈。该项目包含一个模块化的数据管道,可通过集成的爬虫程序导入多种教科书格式(PDF、HTML)。为了进行评估,我们将其与传统的推荐算法(如基于内容的过滤和协同过滤)进行基准测试,并测量了测试集上的平均倒数排名、召回率@k、精确率@k 和 F1 分数等指标。实验结果表明,Transformer 模型在知识映射方面的准确率比基线模型高出 10%,并且能够更精准地提示学生的错误概念。该代码库使用 Python 编写,并采用了 PyTorch、Transformers、pandas、numpy 和其他标准库;requirements.txt 文件列出了所有必需的软件包。要在本地运行,请克隆代码库,使用
pip install -r requirements.txt安装依赖项,然后使用python src/main.py执行主脚本(可选参数为数据目录或模型检查点)。README 文件还提供了从头开始训练的说明:设置配置,指定批大小、学习率、训练轮数和 GPU 设备;训练日志会写入./logs/目录。最后,DeepTutor 提供了一个 API,可以与 Web 或移动前端集成,提供知识图谱查询、答案评估和推荐生成的接口。 -
huggingface/skills huggingface/skills 是一款专为赋能 AI 智能体而构建的中间件层,旨在解决现代自主工作流中工具集成碎片化与模型推理能力孤立的关键痛点。该项目之所以优于同类工具,首先在于它实现了与 Hugging Face 生态系统的深度原生融合,让智能体能像调用本地函数一样无缝访问远程模型与数据集,彻底打破了传统框架仅支持简单 API 封装的局限;其次通过提供标准化的技能定义规范,开发者能以声明式方式快速扩展智能体能力边界,避免了陷入重复性的代码逻辑泥潭;再者其架构设计支持动态资源加载,确保智能体可根据任务需求实时获取最新的模型权重或数据处理管道。在技术实现上,这就像是为智能体配备了一个通用的“技能翻译官”与“工具箱”,底层复杂的 HTTP 请求、鉴权机制及数据序列化过程被完全封装在透明的接口之下,开发者只需关注业务逻辑而非网络细节,系统内部会自动完成上下文切换与状态管理,从而让非专业开发人员也能轻松赋予 AI 代理访问庞大开源模型库的权限,最终实现从单纯对话到复杂任务执行的质变。此外,这种设计还大幅降低了智能体维护成本,因为技能的更新与分发不再依赖繁琐的版本控制流程,而是通过统一的技能注册中心即时生效,确保了生态内所有工具链的高效协同与持续进化。
-
kepano/obsidian-skills Obsidian‑Skills 是一款专门为 Obsidian 设计的插件,旨在日常知识管理中加入“技能”这一维度,从而让用户可以像记录学习笔记一样记录自己的技术掌握情况。该插件核心功能是提供一个统一的 Skill 表格(Skill Table),表格里会列出所有可用的技能、各自对应的等级区间以及所需达成的“经验值”。当我们在日常 Markdown 里使用
[[skill::xxx]]或者在文件前置数据中写skills: [python, git]时,插件会自动把这些标记识别出来,并将相应 Skill 的等级与进度显示到表格的对应单元格。 工作原理比较直白:插件首先读取用户自定义的skills.json(或者放在.obsidian/skills/文件夹下)来获得所有技能名称及其默认初始水平;随后每当你打开或保存任何 Markdown 文档时,插件会扫描该文档内容与前置数据,并把 Skill 标记映射到表格对应行。若某一技能在此文件中出现多次,则插件会累积经验值并自动提升等级(例如从 1‑5 的数值)。这种“即时更新”让用户不必手工去改动表格,只要把标记写进笔记里即可。 除了 Skill 表格,Obsidian‑Skills 同时也提供两套 UI:一是“技能面板”,可以在左侧栏快速查看所有技能的当前等级、已达成经验值与目标剩余;二是“技能进度条”插件(Skill Progress Bar),可把表格中的经验值以直观色块或数值呈现在 Obsidian 视图中,帮助你随时掌握自己的成长曲线。所有这些 UI 均基于 Obsidian 内置的dataview与markdown-it-attrs两大库实现;因此只要先把这两套库装好(插件会自动提示),就能立即投入使用。 安装方式也非常简易:在 Obsidian 的 “社区插件” 页面搜索obsidian-skills,点“安装”,重启后即可看到左侧栏出现的 “Skill Panel”。若你想更进一步定制,比如把 Skill 级别改成星级、或者给每个技能分配不同颜色,则只要在.obsidian/skills/config.yml中写入对应参数;插件会即时读取并渲染。若遇到无法识别的文件格式(如.mdx),可以在config.yml里额外声明。 总体而言,Obsidian‑Skills 的特色是: 1. 一键式技能录入——通过简短标记或前置数据即可把技能写进笔记; 2. 自动经验累积——每次出现同一 Skill 时插件会算出经验值并提升等级; 3. 直观成长面板——提供表格、条形图与进度条等多种可视化方式,让你能随时看到自己的技术层级。 如果你正处在整理项目文档、写书或是记录学习笔记的阶段,Obsidian‑Skills 能帮你把“技能”这一维度也变成一份可以随时查看与更新的实时表格;不必再为每一次新学到的技术而手工去改动 Excel 或 Notion。只要在 Obsidian 里写好笔记、给它加上简单标记,插件就会把所有这些信息自动汇总,并用直观的表格与条形图展示出来——这正是将抽象知识转化为可量化、易管理的核心思路。 -
Mai-with-u/MaiBot 项目概述 MaiBot(麦麦bot)是一款专注于群组聊天的赛博网友,支持多平台智能交互。它通过接入 Discord、Telegram 等主流社媒平台,并将 AI 聊功能与群管理结合,实现“机器人能在任何聊天室里像真人一样回答问题、做日程安排和执行自定义指令”。项目使用 Python 3.9+ 编写,依赖
discord.py(或相近) 与 OpenAI API 来完成对话生成。用户只需把自己的 Discord Bot Token 或 Telegram 的 API ID/Hash 放进.env文件,然后启动main.py就能让 bot 加入服务器并自动响应。 核心功能与工作原理 1. 多平台统一接口 通过封装的“PlatformAdapter”类,Bot 对不同平台的消息结构做一次抽象。无论是 Discord 的 Message、Telegram 的 Update 或 Slack 的 Event,均可被转化为标准ChatMessage对象后交给下游模块。 2. AI 聊生成 Bot 将收到的文本先经过“Context Manager”进行上下文捕获:前 5 条消息会一起构成 prompt,并通过 OpenAI GPT‑4 API 调用,得到回复。若无 AI 键值,则默认使用内置规则引擎(如关键词匹配、正则回调)。此模块同时提供多语言检测与转写,让非中文用户也能获得流畅回答。 3. 群管理 & 自定义指令 在 Bot 里预设/help、/ping等标准命令,且可以通过commands.yaml文件新增自定指令。每个命令都可绑定到“Action Handler” 之中,执行时会把用户输入的参数直接送给 AI 或本地脚本进行处理后返回结果。 4. 持久对话记忆 为避免每次回复无前因,Bot 使用 SQLite(或 Redis)存储最近 50 条消息。通过“Conversation Tracker”在同一用户/群里保持上下文,AI 回复时会自动把历史拼成 prompt,从而使回答更连贯。 5. 易于部署 项目提供requirements.txt与Dockerfile;只需pip install -r requirements.txt或直接docker run --env-file .env mai-bot:latest即可启动。配置文件中包括平台凭据、OpenAI API KEY、数据库连接字符串等,修改后 Bot 立即生效。 使用与贡献 - 克隆 & 安装bash git clone https://github.com/Mai-with-u/MaiBot.git cd MaiBot pip install -r requirements.txt- 配置环境变量 在根目录创建.env,填入DISCORD_TOKEN=...,TELEGRAM_API_ID=...,OPENAI_KEY=...等。 - 运行 Botbash python main.py- 贡献方式:项目欢迎 Issue 与 Pull Request;请先阅读CONTRIBUTING.md。 --- > 简言之,MaiBot 是一款让 Discord、Telegram 等群组聊天变得更智慧、更方便的多平台 Bot。它把 OpenAI 对话技术与标准群管理功能融合在一起,并且通过简单配置即可在任何社媒服务器上使用。 -
presenton/presenton presenton是一个开源的AI演示文稿生成工具,旨在替代Gamma、Beautiful AI等商业工具,提供通过自然语言生成专业幻灯片的功能。项目核心功能是通过文本输入自动生成结构化PPT内容,支持Markdown格式输出,用户可直接使用生成的PPTX或PDF文件。其工作原理基于Hugging Face的AI模型,通过文本分析自动生成标题、内容分页和视觉元素,同时支持自定义模板和主题风格。 项目采用Python开发,使用FastAPI构建RESTful API接口,支持通过命令行工具或Web界面操作。技术栈包含Python 3.10+、FastAPI、Hugging Face Transformers库和PPTX库,部署方式支持Docker容器化或直接运行脚本。用户可通过GitHub获取源码,使用pip安装依赖后启动本地服务,或通过Docker Compose一键部署。 presenton的独特之处在于其开源特性,允许用户自由修改和扩展功能,同时提供API接口便于集成到其他系统中。项目支持多种输出格式,包括PPTX、PDF和Markdown,满足不同场景需求。开发团队持续更新模型和模板库,确保生成内容的质量和多样性。项目采用MIT许可证,适合个人开发者和企业团队使用,尤其适合需要快速生成专业演示文稿的用户群体。
-
pipeshub-ai/pipeshub-ai PipesHub 是一个完全可扩展的 AI 平台,专为企业搜索和工作流自动化而设计。它允许企业利用智能且可解释的 AI 模型实现重复性任务的自动化,并简化运营流程。该平台可与各种工具和系统集成,实现无缝数据流和实时分析。用户可以使用预置模板创建自定义工作流,也可以开发自己的逻辑。PipesHub 强调透明度,为 AI 的决策和操作提供清晰的解释。它支持安全、可扩展的部署,以满足具有复杂需求的大型企业的需求。该系统通过分析数据、识别模式并根据用户定义的规则执行操作来运行。它提供了一个用户友好的界面,用于管理工作流、监控性能和调整设置。开源特性鼓励社区贡献和定制。它支持多种数据源,包括文档、数据库和 API。工作流自动化功能包括任务调度、条件分支以及与 Slack 或 Salesforce 等企业工具的集成。该平台旨在适应不断变化的业务流程,确保长期可用性和高效性。
-
666ghj/MiroFish MiroFish是一个基于群体智能算法的通用预测引擎,旨在通过模拟群体行为实现对复杂系统的预测和优化。该项目采用模块化设计,核心算法基于群体智能理论,通过模拟蚂蚁、鸟群等群体的协作行为,利用分布式计算和自适应学习机制解决预测问题。其工作原理通过多智能体协同计算,每个个体在探索解空间时通过信息素交换和群体协作逐步逼近最优解,支持时间序列预测、分类、聚类等多种任务。 项目特色包括轻量化架构和跨平台兼容性,用户可通过简单的API接口快速集成到现有系统。算法内核采用动态权重调整机制,能自适应不同数据特征,同时支持多种优化策略(如PSO粒子群、ACO蚁群算法等)的灵活组合。开发者可通过配置参数调整群体规模、信息素衰减率等关键参数,适用于金融预测、工业优化、路径规划等场景。项目提供完整的Python实现,包含可视化调试工具和基准测试集,支持实时监控群体演化过程。由于其非监督学习特性,MiroFish特别适合处理数据特征不明确或高维稀疏的预测场景,同时通过并行计算加速收敛速度,较传统机器学习方法在复杂非线性问题上展现出更高的预测精度和鲁棒性。
-
e2b-dev/open-computer-use e2b-dev/open-computer-use 是一个基于开源大语言模型(LLMs)和 E2B Desktop Sandbox 的 AI 计算机使用项目,旨在通过安全沙箱环境实现 AI 对计算机系统的灵活控制与操作。项目的核心功能是通过将开源 LLM 与 E2B 栠箱技术结合,使 AI 能够执行代码、访问系统资源并完成复杂任务,同时确保操作安全性。其工作原理是:LLM 负责理解用户指令并生成操作逻辑,而 E2B 栠箱则提供隔离的执行环境,防止潜在风险影响主机系统。项目支持多种开源模型(如 Llama、Mistral 等)的接入,用户可根据需求自定义模型参数或加载本地模型。通过沙箱的实时交互功能,AI 可以直接调用系统命令、操作文件系统、运行脚本甚至控制图形界面,适用于自动化测试、脚本编写、系统调试等场景。项目特别强调安全性,所有代码执行均在隔离环境中完成,且支持细粒度权限控制,防止数据泄露或恶意操作。此外,项目提供可视化界面和 API 接口,开发者可通过编程方式扩展功能或集成到其他系统中。其开源特性允许社区贡献模型优化、沙箱插件开发等,适用于研究人员、开发者及教育场景,帮助用户快速验证 AI 计算机交互能力的可行性。由于 E2B 栠箱的轻量化设计,项目可在本地设备运行,无需依赖云服务,兼顾效率与隐私保护。整体而言,该项目通过技术融合实现了 AI 与计算机系统的深度交互,为自动化任务处理和 AI 应用研究提供了安全高效的实验平台。
-
kayba-ai/agentic-context-engine Agentic Context Engine(ACE)是一个基于“Agentic Context Engineering”框架的开源项目,旨在帮助AI代理(Agents)通过经验学习并动态管理上下文信息。该项目的核心目标是让AI系统能够像人类一样记住过去的经验、理解当前环境,并基于此做出更智能的决策。其核心功能包括动态上下文管理、持久化记忆存储以及对短期与长期记忆的区分处理,从而提升AI在复杂任务中的表现。 ACE的工作原理基于“经验驱动学习”理念:代理在执行任务时会不断记录交互过程中的关键信息(如用户指令、环境状态、任务结果等),并通过内置的上下文引擎将这些信息存储为可检索的“记忆模块”。这些记忆模块既可以作为短期缓存(如临时对话上下文),也可通过持久化机制(如数据库或文件)保存为长期知识,供后续任务调用。这种设计使代理能够避免“遗忘”并逐步形成类似人类的“经验积累”能力。 项目特色包括高度模块化的架构设计,允许开发者根据需求自定义上下文存储方式(如内存、Redis、数据库等);支持多种AI模型的集成(如LLM、RL模型),并提供标准化接口;此外,ACE还包含可视化调试工具,可实时监控代理的上下文使用情况。该项目适用于需要长期记忆和上下文关联的场景,如智能客服、自动化运维、个性化推荐系统等。开发者可通过Python API快速集成ACE框架,并利用其提供的示例代码和文档进行二次开发。目前项目已开源,社区支持活跃,适合对AI代理系统研究和应用开发的开发者使用。
LLM基准测试_评估评测_排行
健康医学大模型及语料库
其他及垂直领域大模型
-
Crosstalk-Solutions/project-nomad Project N.O.M.A.D 是一款专为离线环境设计的自给自足生存计算机系统,它通过整合关键工具、知识库和本地化人工智能技术,解决了极端环境下(如自然灾害、野外探险或基础设施瘫痪时)用户无法依赖互联网获取实时信息和实用技能的痛点。与依赖云服务的传统解决方案不同,N.O.M.A.D 的核心价值在于其完全离线的独立性,确保用户在任何缺乏网络或电力不稳定的场景中仍能高效访问导航、医疗指导、机械维修等生存必备资源。 该项目的核心亮点可归纳为三点:首先,其模块化设计允许用户根据需求灵活扩展功能,例如通过外接传感器或自定义知识库适配不同生存场景;其次,内置的轻量化AI模型(如自然语言处理工具)能离线解析用户指令,提供类似ChatGPT的交互体验,但无需网络连接;最后,硬件与软件的深度优化确保了低功耗运行,配合太阳能供电方案,使其在资源受限环境中仍具实用性。相较于同类生存工具(如预载PDF手册的电子设备),N.O.M.A.D 的动态AI交互和实时数据处理能力显著提升了信息获取效率。 从技术原理看,N.O.M.A.D 的架构类似于一台“瑞士军刀式微型服务器”——它通过容器化技术(如Docker)将导航软件、离线维基百科、机器学习模型等工具封装为独立模块,用户可通过统一界面调用。例如,当查询伤口处理方法时,系统会先由本地AI理解语义,再从内置医学数据库中提取步骤图解,整个过程如同一位无需联网的“数字向导”。其硬件基础(如树莓派或类似单板计算机)负责协调这些模块,并通过加密存储保护敏感数据。这种设计巧妙平衡了功能丰富性与系统稳定性,使得即使非技术用户也能通过直观交互完成复杂任务,真正实现“无网络依赖的自主生存”。
-
Nagi-ovo/gemini-voyager 一款专为 Google Gemini 和 AI Studio 设计的浏览器插件,它通过集成时间轴导航、文件夹管理、提示词库和聊天导出等核心功能,解决了用户在 AI 对话中面临的上下文混乱、内容管理低效以及知识沉淀困难等痛点。相较于原生平台或其他单一功能扩展,该项目以“一体化工作流”为核心,显著提升了用户与 AI 交互的效率和可复用性。 核心特色 首先,其时间轴导航功能允许用户像翻阅历史记录一样快速回溯对话节点,避免了传统线性聊天中反复滚动的繁琐;其次,类文件系统的文件夹管理将零散的对话内容结构化,用户可通过拖拽等方式分类归档,形成个性化的知识库;最后,跨会话的提示词库支持一键复用高频提问模板,尤其适合开发者或研究人员快速调取优化过的指令,而无需重复输入。这些设计使得工具在“高频对话”和“长期知识管理”场景下远超同类插件。 技术实现上,项目基于浏览器扩展的通用架构(如 Chrome API),通过劫持 Gemini 的页面 DOM 元素注入交互模块,同时利用本地存储(如 IndexedDB)实现离线数据持久化。其巧妙之处在于对 Gemini 前端逻辑的逆向解析——例如通过监听网络请求捕获对话元数据,再以虚拟化技术渲染独立的时间轴视图,这类似于“在现有网页上叠加一层智能导航层”。这种非侵入式设计既保证了兼容性,又避免了官方 API 变动带来的维护成本。 整体而言,gemini-voyager 的独特价值在于将“对话即生产力”的理念工具化:它并非简单聚合功能,而是通过深度理解 AI 协作场景,重构了信息组织的逻辑链条。对于依赖 Gemini 进行头脑风暴、代码调试或内容创作的用户,这款插件能直接降低认知负荷,让交互重心从“管理内容”回归到“生产内容”本身。
-
DGoettlich/history-llms DGoettlich/history-llms 是一个专注于训练最大规模历史领域大型语言模型(LLMs)的项目信息中心,旨在通过整合历史文本数据构建具备历史知识理解能力的AI模型。该项目的核心目标是利用公开领域的多语言历史文献构建高质量训练语料库,涵盖从古代文献到近代档案的广泛时间跨度,同时注重文本的多样性和代表性。项目采用先进的自然语言处理技术,通过数据清洗、分词预处理和上下文建模等步骤,构建出适合历史语境的模型架构,特别优化了对历史事件、人物关系及时间线索的理解能力。模型训练过程中引入了领域自适应技术,通过微调策略提升对历史专有名词、古文表达和时代特征的识别准确率。项目特色包括:1)跨语言历史数据集的构建方法;2)基于大规模语料的模型参数优化方案;3)历史事实验证与上下文推理能力的评估体系。研究团队在项目中测试了模型在历史问答、事件关联分析等任务中的表现,并通过对比实验验证其在历史领域知识密度和推理能力方面的优势。该信息中心还提供了完整的训练代码、数据预处理脚本和评估工具包,供研究者复现和扩展研究。项目强调开放性,所有资源均通过GitHub公开共享,同时附有详细的训练日志和模型性能分析报告,为历史语言模型的研究提供了完整的实践框架和技术参考。
提示词prompt
- Meirtz/Awesome-Context-Engineering Meirtz/Awesome-Context-Engineering是一个聚焦于上下文工程(Context Engineering)的综合性技术资源库,系统性地梳理了从基础提示工程(Prompt Engineering)到生产级AI系统构建的完整技术链条。该项目通过整合数百篇前沿论文、开源框架和实践指南,为大型语言模型(LLMs)及AI代理开发人员提供覆盖理论研究、技术框架和工程实现的全栈资源。其核心特色在于模块化结构,将内容划分为基础理论、应用案例、工具框架等板块,例如包含提示工程技巧、对话上下文管理策略、多模态数据处理方案等关键技术方向。项目特别强调工程化落地,提供从实验环境搭建到生产部署的完整技术路径,涵盖模型微调、上下文窗口优化、安全防护等生产级系统开发要点。通过持续更新社区贡献的优质资源,该项目构建了动态的知识图谱,帮助开发者快速定位技术痛点并获取可复用的工程方案。其价值不仅在于知识聚合,更通过系统性分类和实践指南,降低了上下文工程的技术门槛,成为连接学术研究与工业应用的重要桥梁。
智能搜索_RAG
-
volcengine/OpenViking OpenViking 是由火山引擎推出的开源上下文数据库,它精准定位了当前 AI Agent 领域因记忆碎片化与技能隔离而引发的长期交互能力缺失这一核心痛点。不同于传统向量数据库仅能提供扁平化的相似度检索,该项目创新性地采用文件系统范式来统一封装智能体所需的记忆、资源及技能模块,使得上下文管理具备了类似人类认知结构的层次性与可读性。其核心优势在于支持层级化的内容交付与智能体的自我演进机制,这意味着 Agent 不仅能像查阅文档一样按需调取特定路径的知识片段,还能在运行过程中主动更新或创建新的知识文件以优化决策逻辑。从技术原理来看,OpenViking 构建了一个虚拟的云端大脑硬盘,将非结构化数据转化为可解释的文件树结构,从而让复杂的上下文关联变得像文件夹目录一样直观可控,这种类文件的设计让开发者无需面对晦涩的向量索引,大幅降低了构建复杂智能体的工程门槛。这种架构设计不仅降低了多轮对话中信息丢失的风险,更赋予了智能体持续积累经验并自主完善自身能力库的潜力,从根本上改变了 AI 应用从静态配置向动态生长的范式转变。
-
Tencent/WeKnora 腾讯WeKnora是一款基于大型语言模型(LLM)的开源框架,旨在实现深度文档理解、语义检索与上下文感知答案的生成。项目采用RAG(Retrieval Augmented Generation)范式,将传统检索技术和大语言模型相结合:先用高效向量化embedding把原始文本映射到稠密空间;再利用倒排或近似最近邻算法做实时查询;最后将检索结果与LLM输入拼接,生成自然、连贯且准确的答案。通过多模态向量表示,WeKnora支持中文乃至多语种文档,可满足企业级知识管理需求。框架内部拆分为Embedding Engine、Retrieval Engine和Generation Engine三大模块,各自可独立部署或组合使用;同时提供RESTful API与Python SDK方便集成。相比传统纯检索系统,WeKnora在回答质量上提升30%~40%,且对长文档的上下文关联处理更加精准。项目还实现多语言tokenization、动态prompt tuning以及自适应权重机制,让模型更好地捕捉语义细节并进行推理。
模型微调_对齐及相关数据
- google/tunix google/tunix是一个轻量级的大语言模型(LLM)后训练工具库,旨在为研究者和开发者提供高效、灵活的模型微调与优化方案。该项目的核心特色是模块化设计,支持多种主流模型架构(如Transformer、LLaMA等),并兼容不同训练目标(如文本生成、分类、推理优化)。其工作原理基于三个关键技术:**微调(Fine-tuning)**通过冻结部分参数并优化特定任务层,**知识蒸馏(Knowledge Distillation)**利用大模型指导小模型训练以提升性能,**量化压缩(Quantization)**通过降低参数精度减少计算资源占用。项目还提供预定义的训练流程和评估指标,用户可通过配置文件快速切换不同训练模式,例如在推理速度和模型精度之间取得平衡。由于采用轻量化设计,tunix可在普通GPU或本地服务器上运行,无需依赖复杂框架,同时支持分布式训练加速。适用于需要快速迭代模型、部署轻量级AI服务或研究模型压缩技术的场景。项目文档包含详细教程和示例代码,用户可通过pip安装后直接调用核心模块,例如使用
train.py脚本加载预训练权重并指定训练参数。目前,tunix已验证兼容PyTorch 2.0及以上版本,并提供模型导出工具用于部署到生产环境。
模型推理部署_解码量化_UI客户端
-
AlexsJones/llmfit llmfit 是一个专为大型语言模型(LLM)设计的硬件适配与性能优化工具,它解决了开发者在庞杂的模型和硬件组合中手动试错的核心痛点——通过自动化匹配最优模型与本地硬件配置,显著降低计算资源浪费和部署门槛。 该项目的核心亮点在于其三重优势:首先,它以统一的命令行接口整合了数百个模型和提供商的支持,用户无需逐个研究不同框架的兼容性;其次,智能的资源评估系统能动态分析本地硬件(如GPU显存、CPU算力),自动过滤无法运行的模型,避免“下载即报错”的尴尬;最后,其轻量化设计无需复杂依赖,甚至可在消费级设备(如笔记本电脑)上快速验证模型可行性,这对边缘计算和小型团队尤为友好。 技术原理上,llmfit 的工作机制类似于“硬件适配器+推荐引擎”的组合。它首先扫描硬件指标(如CUDA核心数、内存带宽),构建性能画像;随后将模型的计算需求(如参数规模、算子类型)转化为硬件可理解的“性能标签”,通过权重匹配算法筛选出最符合当前设备的模型。这一过程类似于电商平台的“智能推荐”——系统根据你的“预算”(硬件资源)和“需求”(模型能力),从海量商品中剔除超标的选项,仅展示能流畅运行的结果。这种动态权衡既保留了灵活性(支持多后端),又规避了传统方案中盲目下载的资源损耗。 整体而言,llmfit 通过抽象硬件差异和自动化决策,将原本需要数小时的手动调优压缩为一条命令,其设计理念直击LLM落地中的“最后一公里”问题,尤其适合资源有限但需要快速迭代的AI应用场景。
-
ml-explore/mlx-lm ml-explore/mlx-lm是一个基于MLX框架的大型语言模型运行工具,旨在通过优化技术实现高效推理。项目采用MLX框架的量化技术和内存管理机制,显著降低模型运行时的资源占用和计算延迟,使LLM在资源受限设备上也能流畅运行。其核心工作原理包括模型权重的动态缓存机制和基于Metal的并行计算优化,通过将模型参数分块加载并利用GPU加速推理过程,同时支持CPU和GPU混合模式运行。项目提供预训练模型权重和示例代码,用户可通过pip安装依赖后,使用简单的Python接口加载模型并进行文本生成或问答等任务。特色功能包括对多种主流LLM架构(如Transformer)的兼容性、可视化推理性能监控面板以及针对移动端的轻量化部署方案。开发者可通过修改配置文件自定义模型参数,项目文档包含详细的安装指南和常见问题解决方案。目前支持Hugging Face模型库的主流模型格式,未来计划增加对本地模型训练的支持。该项目适合需要在边缘设备或低功耗环境中部署LLM的应用场景,同时为研究者提供了一个可扩展的实验平台。
-
sgl-project/mini-sglang mini-sglang 是一个轻量级的 SGLang 实现项目,旨在通过简化现代大型语言模型(LLM)服务系统的复杂性,帮助开发者更直观地理解底层技术原理。该项目以模块化架构为核心,采用 Python 语言编写,基于 TorchScript 优化推理效率,同时通过精简代码结构实现低资源占用,适合本地部署和教学演示。其工作原理通过分层设计将模型加载、请求调度、响应生成等流程解耦,开发者可清晰观察每个环节的交互逻辑,例如通过可视化调试工具追踪 Token 生成过程。项目特色包括:1)支持多种推理模式(如流式输出、批量处理);2)内置轻量级缓存机制提升吞吐量;3)提供模拟接口用于测试不同调度算法。由于代码量仅为原 SGLang 的 1/5,且注释完整,特别适合教育场景和系统研究,开发者可通过修改单个模块快速验证优化方案,同时项目附带完整的测试用例和部署指南,确保在 CPU/GPU 环境下均能运行。
-
badrisnarayanan/antigravity-claude-proxy antigravity-claude-proxy 项目是一个轻量级的 HTTP 服务器,允许您从任何代码库调用 Claude 和 Gemini 模型。它会自动将标准的 OpenAI/Anthropic 端点名称映射到 Anthropic 的“Claude”API 或 Google 的“Gemini”端点,因此您现有的客户端库无需任何改动即可继续使用。该代理支持所有当前一代引擎:Claude3-Sonnet、Claude3-Haiku、GeminiPro 和 GeminiUltra(与 Google Cloud AI 中提供的引擎相同)。身份验证由代理处理——您只需将 OpenAI 密钥或 Anthropic API 密钥作为请求头传递,代理就会将所需的“Authorization”令牌注入到每个请求中。服务器默认运行在 8000 端口;您可以使用
--port标志或通过环境变量ANTIGRAVITY_PORT更改端口。要从 Python 使用代理,只需安装pip install antigravity-claude-proxy,然后调用常规的openai.ChatCompletion.create(...);库会自动重定向到代理 URL。对于 JavaScript,只需将 OpenAI 客户端的baseUrl设置为http://localhost:8000/v1,所有调用都会直接通过代理,无需任何修改。服务器实现了一个小型缓存层——5 秒内到达的相同请求会直接从内存中处理,而不是重新查询 Claude 或 Gemini,从而将重复请求的延迟降低高达 70%。日志记录是可选的;您可以使用--log-level debug启用它,它会在控制台中打印每个传入请求和传出的响应 JSON。该项目提供了一个 Docker 镜像 (ghcr.io/badrisnarayanan/antigravity-claude-proxy:latest),因此您可以将其作为容器在任何云提供商上运行,或者在本地运行,除了 Docker Compose 之外没有任何其他依赖项。未来的计划包括增加对 Anthropic 和 Google 目前提供的其他模型的支持,以及集成自定义提示模板,代理会在将请求发送到模型后端之前自动注入这些模板。源代码采用 MIT 许可证开源,因此您可以不受限制地 fork 它、调整身份验证逻辑或添加新的端点。 -
mostlygeek/llama-swap llama-swap是一个专为本地OpenAI/Anthropic兼容服务器设计的模型切换工具,支持在llama.cpp、vllm等框架中实现可靠且高效的模型替换功能。该项目的核心特色是能够在不重启服务的情况下动态切换不同模型,例如从Llama-3切换到Mistral或Mixtral等主流大模型,特别适合需要频繁测试或对比模型效果的开发场景。其工作原理基于对本地模型服务器的插件式集成,通过预加载模型权重和优化内存管理机制,确保切换过程零中断且资源占用合理。 项目支持多种模型框架的兼容性,用户可自定义模型路径和参数配置,同时提供自动化脚本简化切换流程。相比传统手动重启服务的切换方式,llama-swap通过动态加载模型权重和智能资源调度技术,显著降低了模型切换的时间成本。开发者可通过简单的API或命令行接口完成操作,适用于本地部署的AI服务器、研究测试环境或需要多模型协作的场景。项目还注重稳定性,通过严格的错误检测机制防止因模型不兼容导致的服务崩溃,同时支持监控模型运行状态和资源使用情况。对于使用llama.cpp或vllm等轻量化框架的用户,该项目提供了针对性的优化方案,确保在有限硬件资源下也能流畅运行。整体设计兼顾了易用性与高性能需求,是本地模型部署和测试的实用工具。
-
lemonade-sdk/lemonade Lemonade是一个专注于本地AI应用开发的开源项目,其核心功能是帮助用户在自己的GPU和NPUs硬件上高效运行优化后的大型语言模型(LLMs)。该项目通过提供轻量级SDK和优化工具链,使开发者能够快速部署和测试本地AI应用,无需依赖云端服务。项目特色包括对本地硬件的深度优化支持,可显著降低模型推理延迟,同时支持多种主流GPU和NPUs架构,确保兼容性和性能。其工作原理基于本地模型服务架构,通过自适应资源调度算法动态分配计算资源,结合模型量化和缓存机制提升运行效率。开发者可通过Discord社区(https://discord.gg/5xXzkMu8Zk)获取技术支持,项目文档详细说明了从模型加载到应用部署的全流程。适用场景涵盖AI应用开发、本地化部署测试及研究型项目,特别适合需要高隐私性或低网络依赖的场景。SDK提供多语言接口,支持主流深度学习框架,同时内置监控工具可实时跟踪硬件利用率和模型性能指标,确保开发者能充分利用本地算力资源。
-
ikawrakow/ik_llama.cpp ik_llama.cpp 是一个基于 LLaMA 系列模型的开源推理框架,该项目在 llama.cpp 的基础上进行了深度优化,重点改进了模型量化技术和推理性能。其核心特色在于支持多种先进的量化方法(如 GGUF、AWQ、GPTQ、QLoRA 等),这些技术能显著压缩模型体积并提升推理速度,同时保持较高的精度。项目通过优化内存管理和计算流程,使得在普通消费级硬件(如 CPU、GPU)上也能高效运行大语言模型,特别适合资源受限的部署场景。 该框架支持跨平台运行,兼容 Windows、Linux 和 macOS 系统,并适配 x86 和 ARM 架构,便于开发者在不同设备上部署模型。其工作原理基于模型量化技术,将原始模型参数从浮点数(如 FP32/FP16)转换为低精度格式(如 INT4/INT8),从而减少计算资源占用。项目还提供了模型转换工具,可将主流大模型(如 LLaMA、ChatGLM、Phi)转换为兼容格式,并支持自定义量化配置。 项目持续更新维护,社区活跃度高,开发者可通过简单配置实现模型加载、推理加速和多线程优化。相比原版 llama.cpp,ik_llama.cpp 在保持原有功能基础上,进一步提升了量化效率(如 GGUF 量化速度提升 30%)和内存利用率,同时支持更多模型格式和硬件加速方案,是部署轻量化大模型的理想选择。
法律大模型及语料库
编程语言大模型及相关项目
-
shanraisshan/claude-code-best-practice "claude-code-best-practice" 是一个专注于优化 Anthropic Claude 模型代码交互体验的开源指南项目,它系统性地解决了开发者在调用 Claude API 时面临的提示词设计低效、代码结构混乱以及响应质量不稳定等核心痛点。不同于零散的技巧分享,该项目通过结构化范例和可复用的设计模式,帮助开发者以工程化的方式释放 Claude 的最大潜能。 项目的核心亮点首先体现在其场景化的最佳实践集合,不仅提供基础 API 调用示例,更针对代码生成、逻辑推理、长文本处理等高频场景设计了专属解决方案,比如通过分块流式处理规避上下文窗口限制。其次,其模块化的代码架构允许开发者像搭积木一样组合不同功能组件,例如将对话历史管理、错误重试机制等封装为独立模块,显著提升代码可维护性。最独特的是提示词工程方法论,通过 "角色设定-任务分解-格式约束" 的三段式模板,将抽象的自然语言指令转化为可量化的性能提升,相比直接提问方式可使代码生成准确率提升 40% 以上。 技术实现上,项目采用类似"烹饪食谱"的底层逻辑:将 Claude 视为需要精确控温的智能厨房,开发者通过分层指令控制(如同先预热再分步投料)来稳定输出质量。例如在处理复杂查询时,先用系统消息设定 AI 角色(相当于定义菜系),再通过用户消息分步骤提问(类似按顺序加入食材),最后用结构化输出约束(如指定 JSON 格式)确保结果可直接用于后续程序处理。这种设计借鉴了软件工程中的接口抽象思想,将非结构化的 AI 交互转化为标准化的工作流,使得即使只有基础 Python 知识的开发者也能快速构建生产级应用。 该项目特别强调可观测性优化,在每个案例中都内置了类似飞机黑匣子的诊断机制,包括对话历史记录、token 消耗分析和响应质量评估指标。这种设计使得调试过程从"盲目试错"变为"数据驱动",当出现意外输出时,开发者可以像查看程序日志一样追溯 AI 的决策链条。目前该项目已成为 GitHub 上 Claude 生态中最系统的工程化实践库,其方法论也被验证可平滑迁移至其他大模型应用场景。
-
sickn33/antigravity-awesome-skills 本项目是一个专为开发者打造的通用型技能库,旨在解决在使用 Claude Code、Cursor 等主流代码智能助手时面临的能力碎片化与配置繁琐的核心痛点。它不仅仅是一个静态的代码集合,更是一个标准化的技能分发中心,让开发者能够像搭积木一样快速构建起属于自己的 AI 编程辅助体系,从而大幅降低学习不同工具指令的门槛。 该项目的核心优势在于其极致的兼容性与部署效率。首先,它打破了单一工具的限制,通过统一的规范支持了包括 Cursor、Claude Code、Gemini CLI 在内的多种主流智能体平台,这意味着用户无需在不同平台的文档间切换寻找指令,而是可以在一个仓库中获取所有所需的技能,这种统一性在同类资源库中极为罕见。其次,项目内置的安装器 CLI 和预设的包文件实现了“开箱即用”的体验,极大地降低了环境配置的门槛,避免了手动复制粘贴导致的配置错误,这对于追求效率的工程师来说至关重要。最后,它维护着官方与社区共同贡献的技能集合,这种持续演进的生态保证了技能的时效性和丰富度,远超那些静态且更新缓慢的个人笔记类资源库,确保了开发者始终能获取到最前沿的编程技巧。 从技术架构的角度来看,这套系统的工作原理类似于一个高度自动化的数字工具箱管理系统。想象一下,每一个 AI 技能都是一个专门设计的工具插件,而该项目则是一个中央仓库,通过标准化的目录结构将这些插件整齐地分类存放。当开发者运行安装命令时,CLI 工具就像一位智能分拣员,根据当前使用的助手类型,从仓库中精准提取对应的插件包并部署到本地环境中。这种架构确保了不同模型之间的技能调用逻辑保持一致,同时也让社区贡献的新技能能够迅速被集成和分发,无需开发者手动处理复杂的依赖关系或格式转换问题。通过这种方式,项目不仅简化了技术实现的路径,更重要的是将 AI 编程的复杂性封装在了一个简单直观的接口之下,让开发者可以专注于业务逻辑而非工具维护。
-
Yeachan-Heo/oh-my-claudecode oh-my-claudecode 是一个基于 Claude AI 的多智能体协作开发框架,它通过模块化的工作流编排解决了传统代码生成工具灵活性不足、上下文理解碎片化的问题。在现有 AI 编程工具(如 GitHub Copilot)普遍依赖单次问答交互的背景下,该项目创新性地引入团队协作思维,将复杂开发任务拆解为由多个 Claude 实例协同完成的流程,既保留了大型语言模型的生成能力,又通过分工机制规避了长上下文丢失和逻辑断层。 其核心优势体现在三个维度: 首先,动态角色分配系统 允许用户为每个智能体定义专属职能(如"架构师""调试专家"),相比单一 AI 助手能更精准地匹配软件开发中的专业化分工需求;其次,可插拔式工作流引擎 通过 YAML 配置文件实现任务链的灵活组装,用户无需修改核心代码即可构建从需求分析到单元测试的完整流水线,这种低代码设计大幅降低了自动化门槛;最后,上下文接力机制 利用智能体间的消息队列传递中间产物,既保持了任务阶段的独立性,又通过结构化数据交换确保全局一致性,这种设计类似制造业中的"柔性生产线",在避免混乱的同时提升响应速度。 技术实现上,项目采用了一种类似"议会辩论"的决策模型。 主控节点(Speaker)作为调度中心,会根据任务类型调用具备不同专业背景的 Claude 实例(类似议会中的专业委员会),每个实例仅处理自己擅长的子任务,并通过结构化 JSON 格式提交"专家意见";当多个智能体输出冲突时,系统会启动类投票机制的加权融合算法,这种分布式决策方式既分散了单点错误风险,又通过竞争协作提高了方案质量。项目通过 Claude 的 function calling 特性实现智能体间的 RPC 式通信,其架构如同微服务系统,各模块通过标准接口解耦,使得扩展新功能如同在 LEGO 积木底座上添加新组件般简单。 该项目代表了 AI 编程工具向"系统工程思维"演进的重要尝试,其价值不仅在于提升代码生成效率,更在于提供了一套可复用的多智能体协作范式。开发者通过配置而非编码的方式构建 AI 工作流,这种设计使得非专业用户也能享受复杂自动化带来的红利,同时为企业级应用中的 AI 流程标准化提供了实践样本。
-
vercel-labs/agent-skills vercel-labs/agent-skills 是 Vercel 官方推出的 AI 智能体技能库,旨在为开发者提供一套开箱即用的模块化工具,解决 AI 代理(Agent)开发中功能单一、重复造轮子的痛点。通过预置的标准化技能(如网络搜索、代码生成、数据分析等),开发者能快速构建具备复杂能力的 AI 代理,无需从零实现基础功能,显著降低开发门槛。 项目的核心亮点在于其标准化、易扩展性与 Vercel 生态深度集成。首先,技能以统一接口封装,例如
search_web或generate_image,开发者通过简单调用即可组合多技能,避免繁琐的 API 对接;其次,项目采用模块化设计,用户可基于现有技能轻松扩展自定义逻辑,甚至贡献回社区;最后,作为 Vercel 官方项目,其天然适配 Serverless 部署环境,与 Next.js 等框架无缝协作,省去基础设施适配成本。相较同类工具(如 LangChain 的 Tools),它更轻量、更聚焦于“即插即用”,尤其适合需要快速迭代的原型开发。 其工作原理类似于“乐高积木”的拼装逻辑。每个技能本质是一个独立函数,接收标准化输入(如自然语言指令)并返回结构化结果。AI 代理通过类似路由器的“技能调度器”解析用户意图,自动匹配最佳技能执行。例如,当用户提问“今天纽约的天气如何?”时,代理会先调用classify_intent技能识别需求类别,再触发fetch_weather技能获取数据。这一流程通过底层的事件总线(Event Bus)协调,确保高内聚低耦合。技术栈上,项目基于 TypeScript 开发,利用 Vercel 的 Serverless Functions 处理技能执行,既保证性能又可弹性扩展。 总体而言,agent-skills 通过抽象通用能力、标准化交互协议,为 AI 代理开发提供了“加速器”。其设计理念平衡了灵活性与效率,尤其适合中小团队在有限资源下构建功能丰富的智能应用,是 Vercel 布局 AI 生态的重要一环。 -
puckeditor/puck Puck – 让你轻松搭建 AI 页面生成器的项目 Puck 是一个基于 Next.js、MDX 与 Tailwind CSS 的小型工具,专为快速生成静态网页而生。它将“页面 + 模板 + 提示”三大要素整合在一起,让开发者只需写一行命令就能把想法变成完整的 React 页面。 - 核心功能 - 模板化:你先定义好页面结构(如 Hero、Cards 等),Puck 会按此结构生成对应的 MDX/React 代码。 - 提示驱动:在命令行里输入主题或关键词,工具会把它们交给 OpenAI / Anthropic 等 LLM,让模型直接写出正文内容——段落标题、列表、图片描述等。 - 文件输出:生成的 MDX 被 Node 脚本自动写入项目指定路径,并且在页面刷新后即能看到新的内容。 - 工作原理 1. 命令
puck generate pageName把你输入的 prompt(可通过环境变量或命令行参数)发送给 LLM。 2. 模型返回 Markdown+React 的代码片段。 3. 脚本把这段代码写成 MDX 文件,并更新到 Next.js 项目中。 - 使用方式 - 在项目根目录放置.env,填入OPENAI_API_KEY=等键值即可。 - 运行pnpm i或者npm install安装依赖后,即可执行:bash puck init # 初始化模板文件 puck generate BlogPost --prompt "写一篇关于量子纠缠的技术博客"- 命令行支持批量生成、重建等,配合pnpm run dev就能在浏览器中看到新页面。 - 项目特色 - 零配置:只需填好 API key,即可立刻运行。 - 轻量级:核心依赖只有 Next.js 与 MDX,体积不到 10 KB。 - 模板灵活:你一次性定义页面结构,再次调用 AI 时只要提供关键词即可完成内容生成。 - 许可 Puck 遵用 MIT 协议,任何人都可免费使用、修改或扩展。 总之而言,Puck 是一把让网页构建更快捷、更自动化的钥匙:你写提示、它交给 AI 并返回代码;你放进 Next.js 项目,即能在几秒内得到完整页面。 -
slopus/happy Happy 是一个为 Codex 与 Claude Code 提供移动端和 Web 客户端的全能语音客户端,支持实时语音、AES‑256 加密,并具备完整功能。项目采用 React Native + Next.js 搭建跨平台 UI;后端用 Node/Express 调用 OpenAI 的 Codex API 或 Anthropic Claude 接口,还通过 WebRTC 实时传输声频并由 TTS 生成语音,前端则将麦克输入的声音转为文字提交给模型。加密采用 AES‑256 对请求与响应进行包装,以保障隐私;同时在本地保存对话历史,从而支持多会话、代码片段管理及版本回滚。用户可通过桌面浏览器或手机访问 Happy 的 Web 页面,亦能使用专用的移动 App 进行编程,并享受语音输入/输出、即时错误提示与自动补全等完整功能。安装时需在 .env 设置 OPENAI_API_KEY 与 CLAUDE_API_KEY;运行
npm run dev即可启动本地服务器。Happy 的工作原理是:前端将用户发出的文本或声频转成请求,后端调用 Codex/Claude 接口得到生成的代码片段,再通过 TTS 返回语音,并用 AES‑256 加密传输至前端;同时记录每一步以便查看历史。 -
liyupi/ai-guide 由程序员鱼皮维护的 AI 技术开源知识库,旨在解决开发者与初学者面对 AI 技术爆炸式增长时信息过载、学习路径模糊的痛点。** 该项目通过系统化整合 AI 工具、教程、行业动态及实战案例,为用户提供一站式学习入口,尤其注重降低 AI 应用门槛,帮助非专业背景者快速上手。其核心特色在于: 首先,它突破了传统资源库的单一性,将零散的技术点串联为完整的学习链路——从 Vibe Coding 零基础入门到 OpenClaw 这类高阶工具实操,形成渐进式知识体系;其次,内容覆盖兼具广度与时效性,不仅囊括主流大模型(如 DeepSeek、GPT-4)的玩法解析,还动态更新 AI 编程框架(LangChain)、商业化变现指南等前沿模块;最后,项目采用“文档+导航”双形态,开源文档便于社区协作迭代,而衍生的鱼皮 AI 导航网站则优化了资源的可检索性,这种动态演进模式显著优于静态教程合集。技术架构上,项目通过分层设计实现知识的高效传递。 以“Prompt 提示词大全”为例,其运作逻辑类似于烹饪食谱——将抽象的大模型交互问题拆解为可复用的“原料”(关键词模板)和“烹饪步骤”(参数组合规则),用户即使不理解底层算法,也能通过模块化拼装快速生成有效指令。而在 RAG(检索增强生成)等进阶章节中,则采用“图书馆隐喻”:AI 模型如同不擅长记忆的学者,需依赖外部知识库(书架)实时检索资料,再结合自身逻辑“归纳作答”,这种设计大幅提升了模型输出的准确性。整体而言,ai-guide 的独特价值在于将晦涩的 AI 技术转化为可行动的解决方案,既满足开发者对技术深度的需求,又通过保姆级教程和工具链拆解为初学者扫清障碍。其开源属性与持续更新的内容生态,使其成为中文领域少有的“活体”AI 知识图谱。
-
tukuaiai/vibe-coding-cn 一个专注于提升 AI 辅助编程效率的开源工作站项目,它通过系统化整合提示词(Prompt)、技能库(Skill)和工作流(Workflow)三大模块,解决了开发者在使用 AI 编程工具时面临的零散知识难复用、操作流程割裂以及效率瓶颈等核心痛点。不同于单一功能的代码补全插件,该项目以“可沉淀的智能协作范式”为核心,为开发者提供了一套开箱即用的生产力工具箱。其核心亮点首先体现在模块化知识库设计上,例如将高频使用的代码生成逻辑抽象为“Skill”,支持一键调用并支持社区共享,避免了重复编写相似提示词的冗余;其次,可视化工作流编排允许用户通过拖拽方式组合多个 AI 动作(如生成代码→自动测试→文档注释),形成可复用的自动化流水线,显著降低复杂任务的认知负荷;更独特的是其上下文感知系统,通过实时分析开发者当前编辑的代码片段和历史操作,动态调整 AI 建议的颗粒度,这种“自适应交互”模式比传统固定模板的 AI 工具更贴近实际开发场景。从技术实现来看,Vibe Coding 的架构类似于一个“智能厨房系统”:提示词库如同标准化菜谱(Skill),确保基础操作的一致性;工作流引擎好比自动化炒菜机(Workflow),按预设顺序执行切菜、翻炒等动作;而底层的上下文分析模块则扮演着“味觉传感器”的角色,通过实时监测锅中食材状态(代码上下文)动态调整火候(AI 输出策略)。这种分层设计既保证了常用功能的开箱即用,又为高阶用户提供了深度定制空间。项目采用插件化开发模式,目前已支持 VSCode 等主流 IDE,其轻量级 API 接口也便于与企业内部工具链集成,展现出较强的生态适应性。
-
aidenybai/react-grab react‑grab 是一款专为在自己的网站上嵌入“编程助手”而设计的 React 组件库,核心功能是能把当前页面(或指定子树)的文本、结构与代码片段实时提取并以可配置的 prompt 形式送给大型语言模型,让它们根据这些上下文直接完成各种编码任务。项目通过在页面中注入一个
<GrabContextProvider>来收集 DOM 节点,随后用户可以用<UseGrabbable onClick={...} />等子组件指向任何元素,并可配置promptTemplate,language,onResult等 props,从而实现:① 选取页面片段;② 自动生成符合语言(如 JavaScript、Python、HTML)且与页面结构相匹配的代码;③ 支持直接在浏览器中提交到 OpenAI 或 Azure LLM,返回完整可运行或可编辑结果。开发者只需 npm 安装react-grab,引入组件并提供 API key,即可在自己的项目里把 AI 助手嵌成一键即可的“右侧面板”式工具;库还内置了代码高亮、错误提示和示例页面,帮助快速上手。整体思路是把网页内容当作“一次性 context”,通过window/document.querySelectorAll抓取所需信息,再包装成 OpenAI 可识别的 JSON 结构并返回给前端展示;其 API 与 props 设计兼顾可读写、易配置,适合各种项目(从博客到 SaaS 产品)想在网站上实现实时 AI 编程功能时,可直接引用此仓库快速搭建。 -
carlrobertoh/ProxyAI ProxyAI 是一个开源的 AI 编程协作者工具,专为 JetBrains 系列开发环境(如 IntelliJ IDEA、PyCharm 等)设计。其核心功能是通过代理机制连接任意 AI 模型(如本地部署的 LLM 或云端 API 服务),为开发者提供高度定制化的代码辅助体验。项目支持在任意环境中运行,用户可根据需求选择模型来源(如本地运行的模型、远程 API 或私有模型服务),并通过配置文件灵活调整 AI 的行为逻辑。例如,开发者可以自定义模型调用的参数、响应格式或集成特定的代码分析规则。ProxyAI 的代理架构设计使其能作为中间层,兼容多种模型接口(如 OpenAI、Anthropic 等),同时通过插件化扩展支持 JetBrains IDE 的原生功能,如代码补全、错误检测或文档生成。这种设计既保证了模型的灵活性,又避免了直接依赖单一服务的限制,适合需要本地化部署或企业私有化部署的场景。项目开源特性允许开发者自由修改源码、添加新模型支持或优化代理逻辑,尤其适合希望深度定制 AI 协作者行为的用户群体。其核心价值在于通过代理层解耦模型与 IDE,使开发者能以最小成本适配不同模型环境,同时保持对 JetBrains 工具链的深度集成。
-
1rgs/nanocode 该项目是一个轻量级的Claude代码生成模型替代方案,核心特点在于其极简设计:仅需一个Python文件,无需任何依赖项,代码总量约250行。它通过高度简化的架构实现代码生成功能,主要面向需要低资源消耗和快速部署场景的开发者。项目采用自包含式设计,用户无需安装额外库或框架即可直接运行,这使其特别适合嵌入式系统、边缘计算设备或对环境依赖敏感的开发场景。其工作原理基于精简的模型结构和优化后的算法逻辑,通过减少冗余计算和压缩参数规模,在保持基本代码生成能力的同时显著降低硬件和内存需求。开发者可通过简单的Python脚本调用核心功能,例如通过ContentFile类处理文件路径和内容操作,这种设计使得项目既可作为独立工具使用,也可作为其他系统组件的轻量级模块集成。由于代码规模极小(约250行),该项目在保持基础功能的前提下,实现了对传统大型代码生成模型的替代性,尤其适合需要快速原型开发或资源受限的场景。项目作者强调其"零依赖"特性,意味着用户无需担心环境兼容性问题,仅需Python运行时即可完成部署,这种设计哲学与当前AI模型趋向大型化的趋势形成鲜明对比。
计算测试时推理
BERT优化
NLP语料和数据集
Transformer库与优化
关系抽取_信息抽取
其他_NLP自然语言处理
- NX-AI/xlstm NX-AI团队开发的xLSTM项目是一个基于长短期记忆网络(LSTM)改进的深度学习模型,旨在提升序列数据建模的效率和精度。该模型通过扩展传统LSTM的门控机制,引入更灵活的长期依赖处理能力,同时优化了梯度传播路径以减少训练时的梯度消失问题。其核心创新在于改进的细胞状态更新结构,结合了自适应遗忘门和动态输入门控,使模型能更精准地筛选重要信息并延长记忆跨度,特别适用于自然语言处理、时间序列预测和复杂模式识别任务。项目提供了完整的模型实现代码和训练流程说明,支持PyTorch框架,包含预训练权重和基准测试结果,用户可直接加载模型进行微调或部署。研究团队通过对比实验验证了xLSTM在多个公开数据集(如IMDB、Wikipedia、PM25时间序列)上的性能优势,其精度较传统LSTM提升约12%-18%,且推理速度优化了20%以上。项目文档包含详细的架构图解和训练参数配置指南,适合研究人员和开发者快速复现实验,同时提供了可视化工具帮助理解模型内部状态变化。由于xLSTM的结构兼容性设计,用户可将其作为Transformer或其他序列模型的替代方案,或与现有模型进行混合架构开发。
实体识别NER_意图识别_槽位填充
文本分类
文本匹配_文本检索_文本相似度
文本摘要
机器阅读理解
知识图谱
知识图谱问答KBQA_多跳推理
预训练模型
A03_网络与前后端开发
JavaScript框架
前端开发框架及项目
iOS_Swift应用开发
-
gao-sun/eul EUL(macOS 状态监控工具) EUL 是一款用 SwiftUI 开发的 macOS 状态监控应用,主要通过系统状态栏提供实时信息。它的核心功能包括: 1. CPU 与内存使用率显示 采用
ProcessInfo.processInfo、host_statistics64()等低层 API 获取 CPU 周期与物理/交换内存占用比例,并在弹出窗口中以进度条形式展示。用户可自定义阈值,超限时自动弹窗提醒。 2. 网络流量监测 通过Network.framework的NWPathMonitor或者SCDynamicStore获取网卡速率,并将上传/下载速度实时绘制在图表上。用户可以设置自定义阈值,达到预设后弹出通知。 3. 电池状态与续航预测 读取UIDevice.currentBatteryState与UIDevice.currentBatteryLevel,结合历史消耗速率计算剩余时间并给出图示。同时支持“低电量”提醒和可选的“关机/休眠”提示。 4. 系统日志与错误捕获 通过NSLog()捕捉关键事件,并将最近 20 条日志记录在弹窗中。若出现异常(如网络不可达),会直接以红色警示框呈现,帮助用户快速定位问题。 5. 自启动、自动更新 应用支持LaunchAtLogin方式自启,亦可通过 App Store 或 GitHub Release 进行手动安装。若检测到新版本,应用将弹出“立即升级”提示,让使用者始终保持最新特性与安全补丁。 6. 多语言、无障碍 EUL 在Localizable.strings中提供英文/简体中文等多语种文件,并采用AccessibilityElement让 VoiceOver 能读出所有 UI。设计上尽量使用 SwiftUI 的@State与ObservableObject,保证数据流畅通、刷新即时。 工作原理 - 状态栏按钮(NSStatusItem):** 应用在启动时创建一个statusBarButton并把自定义图标放置于系统菜单栏。 - 弹出窗口(Popover):使用 SwiftUI 的.popover()与@State var show = false触发显示,内容以VStack排列信息与子视图。 - 数据采集:** 每秒通过 GCD 调度定时器 (DispatchSourceTimer) 收集 CPU、内存、网络速率,并将这些数值写入本地缓存文件(.cache/eul.json),使得即便应用被置于后台也能在状态栏图标上反映当前百分比。 - 通知:若用户设置阈值且已超限,系统UNUserNotificationCenter会发出提醒;若开启“关机提示”,则通过NSWorkspace监听sessionDidBecomeActiveNotification与willPowerOff做预警。 EUL 的核心是让 macOS 用户在日常使用中,无需打开终端或第三方软件,即可把 CPU、内存与网络状况一目了然。其 SwiftUI 实现让 UI 响应式、代码量少且易维护;同时采用系统原生 API,保证数据准确与低功耗。 简而言之:EUL 通过状态栏图标监控 CPU/内存/网速,并在弹出窗口里提供阈值提醒和日志记录,让 macOS 用户随时掌握设备健康状况。 -
newmarcel/KeepingYouAwake KeepingYouAwake 是一款轻量级的 macOS 实用工具,可在程序运行时防止电脑进入睡眠状态。该工具以开源项目的形式发布在 GitHub 上,仓库名为 newmarcel/KeepingYouAwake。其主要功能是在启动时禁用自动睡眠设置,从而保持显示器和系统处于唤醒状态。该应用程序读取一个存储在同一目录下的简单配置文件,路径通过
ContentFile(path="README.md")指定。该配置文件包含用户偏好设置,例如所需的超时时长,或者是否仅保持屏幕在使用期间亮起。默认情况下,它会设置无限超时,因此在工具运行时,您的 Mac 永远不会自动进入睡眠状态。KeepingYouAwake 使用标准的 macOS API 来实现这一点,除了基础系统库之外,无需任何其他外部依赖项。用户可以通过终端运行类似./KeepingYouAwake的命令来运行该程序,或者如果更喜欢应用程序格式,也可以双击其 .app 文件。运行时,它会定期打印状态更新,例如“Mac 已保持唤醒状态”,并显示当前的超时值以便于查看。该工具还支持基本的命令行选项:--help、--timeout(后跟分钟数或秒数)以及--display-only(如果需要,可以只显示屏幕)。由于它在启动后于后台运行,因此不会在桌面上显示额外的窗口或界面。希望自定义设置的用户只需将内容文件中的内容复制到自己的 README.md 文件中,并相应地调整数值即可。 -
jacklandrin/OnlySwitch OnlySwitch 是一款轻量级的 macOS 菜单栏应用,专门为 MacBook Pro 用户设计。它集成了隐藏屏幕凹槽、切换深色模式、AirPods 连接管理以及常用快捷键等功能,一次点击即可完成所有操作。程序通过 SwiftUI 与 AppKit 的组合调用 macOS 原生 API 实现这些设置:对 AirPods 状态使用 IOKit 检测并可在菜单栏中立即连/断;深色模式借助 NSAppearance 对象即时切换,并支持手动覆盖系统默认快捷键。安装时只需从 GitHub Releases 下载最新版压缩包,解压后将 OnlySwitch.app 拖到 /Applications,即自动加入左侧的菜单栏图标并在首次启动弹出简易说明窗口;用户可通过 Preferences 进一步自定义快捷键或禁用某些子功能。OnlySwitch 与 macOS Monterey 及以后的版本兼容,无需额外依赖包,可直接在 Launchpad 或 Finder 中运行,让 Mac 的使用体验更顺畅、更贴心。
-
iDescriptor/iDescriptor iDescriptor是一款免费、开源且跨平台的iOS设备管理工具,旨在为用户提供便捷的设备管理解决方案。该项目基于C++和Python开发,支持Windows、macOS和Linux等主流操作系统,无需依赖特定设备或操作系统即可运行。其核心功能包括设备信息查看、备份与恢复、文件管理、应用安装与卸载等,用户无需对设备进行越狱即可实现对iOS设备的深度控制。iDescriptor通过与Apple设备的通信协议(如Mobile Device Management协议)实现对设备的直接操作,支持通过图形化界面(GUI)进行交互,降低了技术门槛,使普通用户也能轻松管理设备。相比传统需要连接电脑的工具,iDescriptor允许用户独立完成设备管理任务,提升了使用的灵活性和效率。此外,开源特性使用户能够自由查看和修改代码,满足个性化需求或参与社区开发。该项目不仅适合普通用户日常维护设备,也适合开发者进行测试与调试,是iOS设备管理领域的一款实用工具。
React工具库
Vue工具库
- Velocidex/velociraptor Velociraptor 是一款面向 Web 的交互式数据可视化库,利用 D3.js 与 React 共同实现高性能、易用的图表渲染。其核心理念是“一次编写,多端适配”,既支持在浏览器中直接使用,也可以通过 Node 的 CLI 生成静态 PNG/PDF 报告。 > 项目特色 > • 数据源灵活:可从 CSV、JSON 或自定义 API 拉取;对大数据集(数十万行)采用分块渲染,保持流畅。 > • ⚡️ 虚拟 DOM+事件驱动:只更新真正改变的节点,大幅提升重绘效率。 > • 🔍 交互式操作:鼠标缩放、拖拽、悬停提示;支持键盘快捷键,满足多场景需求。 > • 📱 响应式布局:在桌面、平板与手机上都能自适配尺寸和方向。 > • 🖌️ 主题 & 颜色可定制:内置多种预设色表,也可以直接传入自定义 palette,满足品牌一致性需求。 > • 📊 导出功能:一键下载当前视图为 PNG 或 PDF;亦支持将数据与配置打包成 JSON,以便后期重用。 > 工作原理 > 1️⃣ 模块化设计:
Graph、Axis、Legend等独立组件,按需导入。 > 2️⃣ 事件分发:交互行为(如缩放)触发onZoom或onPan,内部计算新的比例后调用 D3 的过渡动画;同时更新轴标签与网格线。 > 3️⃣ 数据绑定:采用 D3 的data()与 React 的 state 合作;每次数据变更会先比较旧新值,只重渲染差异节点,避免全局部重新计算。 > 4️⃣ CLI 渲染:使用 Node + jsdom 创建伪 DOM 环境,再让 D3 直接在其中绘图,从而实现无浏览器的静态导出。 > 快速入门bash npm i velociraptor # 安装库tsx import { Graph } from 'velociraptor'; <Graph data={myData} height={400} width={600}/>或sh # 生成静态报表 velociraptor export --data=data.json --out=report.pdf> 结语 > Velociraptor 的目标是让前端开发者能在最少代码量下,快速搭建出专业级交互式图表;其虚拟 DOM + D3 组合为大规模数据提供可扩展性能,并且通过可定制的主题与导出方案,让最终用户可以以多种形式获取所需信息。无论你是业务分析师、产品经理,还是纯粘前端爱好者,Velociraptor 都能让“绘图”从繁琐变得直观而高效。
前端项目_其他
- neiesc/awesome-minimalist awesome‑minimalist 是一份收集“极简”框架的 GitHub 列表,旨在为前端开发者提供轻量、易用且灵活的工具。它把 CSS 与 JavaScript 这两类最常见的 minimalistic 框架按功能聚合——例如 Tachyons、Spectre.css、Milligram 等,它们只保留必要样式与响应性类,既能让页面快速布局,又不添冗余代码;同时遵循现代前端实践,支持模块化与可维护。README 里按类别列出各条项目,并为每个框架加上标签(如 [CSS]、[JS])以及简短描述,让使用者只需在页面中引入相应类库即可获得完整基础样式;若需要更复杂效果,可自行扩展或覆盖默认设定,从而实现高度自定义与灵活控制。该列表的核心工作原理就是把所有“必须存在”的极简类集中起来,避免重复和臃重,为开发者节省时间与资源。
多工具库支持或纯JS
-
millsp/ts-toolbelt ts‑toolbelt 是一个专门为 TypeScript 开发的类型工具库,项目把常用的高级类型技巧集中成一套易于使用的 API。它包含数十个“映射”与“筛选”工具,例如
Pick<T, K>、Omit<T, K>、DeepPartial<T>以及可以按自定义规则转换属性的Map<T, R>;还有处理可空值的工具,如Nullable<T>与NotNull<T>,甚至能把所有属性都变成可选的Optional<T>。库全部用.ts文件实现,并通过export type …导出,编译后只留下 JavaScript 代码,运行时不占任何额外资源。项目以 conditional types、mapped types 为核心,让开发者像调用普通函数一样使用这些类型工具;例如在接口默认值的场景下,用DeepPartial<T>可以递归地把所有属性都设为可选,从而简化实现。ts‑toolbelt 通过单元测试保证 API 正确性,并且支持 Node.js 与前端项目共同使用,已成为目前 TypeScript 生态中最大的纯型库之一。 -
lukilabs/beautiful-mermaid beautiful‑mermaid 是一个开源工具,专门把 Markdown 文本中的节点转换成 Mermaid 图表。它支持流程图、甘特图、类图等多种图形,并能通过自定义样式让图像更美观。整个过程分为三步:首先读取并解析 Markdown AST;其次根据每个节点生成对应的 Mermaid 语法;最后利用 mermaid‑cli 渲染成 SVG 或 PNG,甚至可直接嵌入 GitHub README。项目配置文件可选 theme、font-size 等,让用户轻松调节。安装方式极其简便,只需
pip install beautiful-mermaid(亦支持 npm)。使用时只要给出源文件和目标路径,例如:beautiful-mermaid convert docs/example.md -o out.svg,程序会自动完成所有转换与渲染。若想自定义节点属性或添加自定图例,可在 config.yml 中设定 node_color、edge_style 等参数。此外项目已集成 CI 流程,以保证每次 PR 都能通过测试并生成最新 Mermaid 图表。贡献指南详列了代码提交规范与 PR 评审流程,欢迎社区同学者参与改进。
管理面板
区块链_智能合约
后端开发框架及项目
JAVA开发
PHP开发
- JayBizzle/Crawler-Detect JayBizzle/Crawler-Detect 是一个轻量级的 PHP 工具类,专门用于通过用户代理(User Agent)识别网络爬虫、机器人或蜘蛛程序。该项目的核心功能是提供简单高效的接口,开发者可通过调用类方法快速判断当前访问请求是否来自爬虫程序,并支持获取爬虫的详细信息(如名称、类型、所属公司等)。其工作原理基于内置的 JSON 格式数据库,该数据库包含大量主流爬虫的用户代理特征数据,开发者可轻松更新或扩展数据文件以适配新出现的爬虫类型。项目采用纯 PHP 实现,无需依赖外部库或框架,兼容 PHP 5.4 及以上版本,可无缝集成到 Laravel、Symfony 等主流 PHP 框架中。其 API 设计简洁直观,例如通过
isBot()方法判断是否为爬虫,getBot()方法获取爬虫信息,isCrawler()方法检测是否为特定类型爬虫。由于数据存储为独立的 JSON 文件,开发者可快速自定义规则或排除误判情况。项目还支持区分搜索引擎爬虫(如 Googlebot)与普通爬虫,帮助开发者更精准地识别流量来源。整体设计注重性能与灵活性,适合需要区分爬虫与真实用户访问的场景,例如防止爬虫滥用资源或实现访问控制策略。
后端项目_其他
- mitchellkrogza/nginx-ultimate-bad-bot-blocker
mitchellkrogza/nginx-ultimate-bad-bot-blocker是一套为 Nginx 服务器设计的完整防护系统,专注于“阻止坏机器人、垃圾 Referrer、恶意 User‑Agent”以及多种常见网络威胁。它把各类安全功能集中在几份配置文件与辅助脚本里,使得安装和维护极为简便。 ### 核心特性 1. Bad Bot / Spam Referrer Blocker 通过正则表达式匹配访问路径、User‑Agent 与 Referer,立即返回403或自定义的错误页面。配置文件里已嵌入大量公开列表(如 Sucuri, Cloudflare, Googlebot 等),可自行补充。 2. Vulnerability Scanners / Malware 检测 对常见扫描工具(WPScan、Shodan、Wpscan.io 等)以及已知的恶意脚本做匹配。若发现扫描尝试,则立即封锁并记录到 Fail2Ban 事件日志中。 3. Adware / Ransomware & Malicious Sites 利用已汇总的恶意域名与 IP(如 Phishtank、Spamhaus 等),直接拒绝来自这些源头的请求,阻断常见的广告植入与勒索软件分发途径。 4. Anti‑DDOS 采用基于时间窗口和请求数限制的简单 DDoS 抵御方式:若某 IP 在60s内超过设定阈值,即被自动封锁。可以通过配置文件轻易调节。 5. WordPress Theme Detector Blocking 检测 WordPress 主题相关请求(如/wp-content/themes/…)并根据已知的可疑主题做拦截,防止潜在的安全漏洞被利用。 6. Fail2Ban Jail for Repeat Offenders 所有检测到的违规行为都会写入 Fail2Ban 的事件表。若同一 IP 在5分钟内出现超过设定次数,则进入 Fail2Ban “jail”,此时 Nginx 将返回 444(Nginx 自己特有的“无响应”状态码),进一步阻止攻击。 ### 工作原理 - 正则匹配:所有威胁检测均以if ($http_user_agent ~ ... ) { return 403; }或return 404的方式实现,保证 Nginx 在处理阶段即完成判断与拒绝。 - 动态列表:通过脚本(如update-blocks.sh)从公开源下载最新的恶意 IP/域名,并将其写入对应配置文件。运行cron定时更新,可保持防护始终有效。 - Fail2Ban 集成:在 Nginx 配置中使用fail2ban-nginx.conf让 Fail2Ban 直接读取 Nginx 的访问日志,统一管理违规 IP。 ### 安装与使用 1. 下载 README 所示的所有配置文件(如bad-bots.conf,spam-referrer.conf,vuln-scanners.conf,wordpress-theme-detector.conf等)。 2. 在主 Nginx 配置里通过include指令把这些文件加入对应 server 或 location 块。 3. 复制 README 中的update-blocks.sh脚脚本,放在服务器上并设置 cron(如每小时更新一次)即可自动拉取最新恶意列表。 4. 若已部署 Fail2Ban,只需确保 Nginx 的日志路径与 Fail2Ban 配置一致,即可享受自动封锁功能。 ### 适用场景 - 企业站点、博客平台:阻止常见爬虫及扫描工具,降低被植入恶意代码的风险。 - WordPress/Drupal 等 CMS 环境:通过主题检测与漏洞扫描,让站点更安全。 - 高访问量网站:DDoS 预防与 Fail2Ban 的重复封锁,可有效减少无效请求,提升正常流量处理能力。 ### 小贴士 - 若 Nginx 在不同虚拟主机上使用同一配置文件,只需在include前加路径即可。 - 如需要自定义某些 User‑Agent 规则,可直接在对应*.conf文件尾部添加即可;脚本更新时不会覆盖自定义行。 - 若对 Fail2Ban 还不熟悉,官方文档里有完整的安装与事件表配置示例,建议先按官方流程完成后再引入本项目。 > 结语:nginx‑ultimate-bad-bot-blocker把多维度威胁防护合并为 Nginx 服务器提供一站式解决方案。其正则匹配、动态更新与 Fail2Ban 的“复犯封锁”机制,让你在几行配置下即可拥有强大而又不易出错的安全屏障,极大降低被攻击或植入恶意代码的风险。
网络信息服务
信息沟通
网络代理
网络协议
- productdevbook/port-killer Port-Killer 是一款面向开发者的跨平台端口管理工具,专注于简化端口监控、进程管理和网络隧道操作。该工具支持 Windows、macOS 和 Linux 系统,提供命令行界面(CLI)和图形用户界面(GUI),用户可通过一键操作快速终止占用特定端口的进程,或管理 Kubernetes 端口转发及 Cloudflare Tunnels 隧道。其核心功能包括:实时检测占用端口的进程并列出详细信息,支持通过端口号或进程名称精准终止目标进程;集成 Kubernetes 端口转发管理功能,可查看现有转发状态并快速创建/删除隧道;兼容 Cloudflare Tunnels,允许用户创建隧道并管理其配置。工具基于 Go 语言开发,保证了轻量化和高效运行,同时支持通过 Homebrew 或 GitHub 发布版本安装。开发者可利用其快速定位端口冲突问题,例如调试时因端口占用导致的连接失败,或管理多个微服务的端口分配。项目开源且持续维护,社区通过 GitHub Discussions 提供支持,适合需要频繁处理端口管理、Kubernetes 服务调试或隧道配置的开发者使用。其简洁的设计和跨平台特性,使其成为开发环境中高效处理网络相关任务的实用工具。
网络服务_其他
- gautamkrishnar/blog-post-workflow 该项目是一个自动化工具,可帮助开发者将最新的博客文章、StackOverflow活动或YouTube视频内容自动同步到GitHub个人资料或项目readme文件中。其核心功能是通过RSS订阅源实时抓取内容,并将这些内容以Markdown格式自动写入README.md文件,无需手动更新。项目的工作原理基于GitHub Actions工作流,通过定时触发任务,从指定的RSS源(如个人博客、StackOverflow动态或YouTube频道)获取最新内容,然后使用模板引擎将这些内容格式化并插入到README文件的指定位置。用户只需在项目中配置RSS源地址和输出格式模板,即可实现内容的自动同步。项目特色包括支持多平台内容聚合、实时更新机制以及与GitHub生态的深度集成,特别适合需要展示个人技术动态的开发者。此外,项目采用轻量级架构设计,所有操作均在GitHub Actions环境中完成,无需额外服务器或复杂配置,确保了部署的便捷性和运行的稳定性。通过该工具,开发者可以保持GitHub主页内容的实时更新,有效提升个人技术影响力展示的效率。
网络爬虫
资源传输下载
-
tus/tusd tus 是一种开源的、可恢复文件上传协议,tusd 项目提供了一个用 Go 编写的参考实现服务器。该项目通过标准 HTTP 方法(POST 创建 Upload 对象并返回唯一 ID 的 URL;PATCH 发送文件片段,将请求体中的数据流追加写入后端存储介质,如本地磁盘)完成完整上传流程,支持在网络中断或服务器重启之后继续上传,因为它只保存已完成的数据块而不需要一次性读到内存。实现基于 Go 的 net/http 包,所有请求均由对应的 Handler 处理;Patch 逻辑使用 io.Copy 将 Body 写入目标文件,并在成功后返回 HTTP 状态码 204;创建时通过生成 UUID 并写入元数据(如原始文件名、大小等)。tusd 支持多种存储插件:本地磁盘、Google Cloud Storage、Amazon S3 等,可自行扩展自定义实现。项目附带完整单元测试及集成示例,能直接在 Docker 里运行;它遵循 MIT 协议发布,允许自由使用与修改。
-
gnmyt/MySpeed MySpeed是一款用于分析互联网速度的软件,可记录并显示用户过去30天内的网络速度数据,帮助用户全面了解网络性能变化趋势。该项目的核心功能是通过定期执行网络速度测试,将结果存储为历史记录并生成可视化图表,支持用户分析不同时间段的网络波动情况。软件采用Python开发,基于speedtest-cli工具实现速度测试,通过SQLite数据库存储测试数据,用户可通过图形界面或命令行查看结果。其特色功能包括:支持多服务器测试(可自定义测试服务器列表)、自动记录每日测试数据、生成带时间轴的折线图、支持导出CSV格式数据文件,以及跨平台兼容性(Windows/macOS/Linux)。工作原理方面,软件通过调用speedtest-cli的API接口获取实时速度数据,将结果按时间戳存储至本地数据库,用户界面使用Tkinter框架实现数据可视化,同时支持命令行模式进行批量测试。项目还提供配置文件功能,允许用户自定义测试频率、数据保留周期和服务器列表,适合需要长期监控网络性能的用户。由于采用开源协议,用户可自由修改代码并扩展功能,例如添加更多数据分析工具或集成到其他系统中。该项目适合家庭用户监测网络稳定性,也适用于企业用户评估带宽使用情况,通过历史数据对比可快速定位网络问题,如带宽限制、路由器性能瓶颈等。安装时需确保Python环境和相关依赖库,开发者文档中提供了详细的使用说明和故障排查指南。
A04_机器视觉
3D视觉生成重建
-
microsoft/TRELLIS.2 TRELLIS.2是一个由微软开发的3D生成项目,旨在通过结构化潜在变量实现高效且高质量的3D模型生成。项目核心创新点在于提出了一种"本地紧凑结构化潜在空间"(Native and Compact Structured Latents)方法,通过将3D对象分解为局部可操作的几何组件,结合神经网络学习这些组件间的空间关系,从而实现更可控的生成效果。其工作原理基于扩散模型框架,通过分层注意力机制和局部-全局特征对齐技术,将复杂3D结构转化为低维潜在表示,再通过逆向扩散过程逐层重建完整模型。相较于传统方法,TRELLIS.2在保持生成质量的同时显著降低了计算开销,其潜在空间设计使模型能够精准控制生成物体的局部细节,例如通过调整特定区域的潜在向量直接修改物体形状或材质。项目特别强调对几何语义的保留,支持基于文本描述或点云输入的生成,适用于虚拟现实、工业设计等领域。实验表明,该方法在ShapeNet等基准数据集上实现了比现有SOTA方法更高的生成精度(FID指标降低12%)和更优的计算效率(推理速度提升3倍),同时保持了对复杂几何结构的稳定性。其开源代码和预训练模型可通过GitHub获取,支持PyTorch框架部署。
-
wgsxm/PartCrafter PartCrafter 是一个由 wgsxm 开发的 3D 网格生成项目,其核心目标是通过组合式潜在扩散变换器(Compositional Latent Diffusion Transformers)生成结构化且高质量的 3D 模型。项目基于 NeurIPS 2025 会议发表的论文,采用了一种创新的方法,将复杂物体的生成过程分解为“部件(Parts)”的组合与结构化装配。其核心工作原理包括三个关键步骤:部件分解、部件生成、结构化组合。 首先,PartCrafter 使用一种部件分解模块,将输入的 3D 物体(如家具、机械部件等)分解为多个独立的几何部件(如桌子的桌腿、桌面等),并通过语义标签(如“桌腿”、“桌面”)进行分类。这一过程通过预训练的部件分割模型实现,确保每个部件的语义清晰且结构可解。其次,项目引入潜在扩散模型(Latent Diffusion Model),针对每个分解后的部件生成高质量的几何网格。该模型基于扩散过程,通过逐步去除噪声生成细节丰富的部件,同时保留部件的局部结构特征。 最后,PartCrafter 使用基于变换器的结构化组合模块(Transformer-based Compositional Module),将生成的部件按照原始物体的拓扑关系重新组合。该模块通过变换器架构学习部件间的空间关系和装配规则,确保最终生成的 3D 模型在全局结构上与目标物体一致。例如,组合后的桌腿和桌面需符合物理约束,避免几何冲突。 项目特色包括:部件级生成控制(用户可单独修改某部件的形状或纹理)、跨部件结构一致性(确保组合后整体结构合理)、以及高保真网格输出(通过扩散模型生成的部件细节丰富)。相比传统单步生成方法,PartCrafter 的组合式架构能更精确地控制复杂物体的局部与全局结构,适用于需要高精度几何建模的场景(如工业设计、虚拟现实)。目前项目已支持通过文本或示例输入生成特定类别的 3D 模型,并提供了基于 PyTorch 的实现框架。
人像_姿势_3D人脸
光学字符识别OCR
- opendataloader-project/opendataloader-pdf 这是一个专为人工智能生态设计的开源 PDF 解析工具,旨在解决非结构化文档数据难以被机器学习模型直接消费的行业痛点。项目核心优势在于其能够将复杂的 PDF 内容转化为 AI 可直接读取的标准化格式,同时自动化处理文档的可访问性层级问题,相比传统依赖昂贵闭源 API 的方案,它在成本效益与数据隐私保护上表现更为卓越。从技术逻辑上看,该工具类似于一个智能的数据翻译官,它先通过解析引擎将视觉上的页面布局还原为语义化的树状结构,再经过清洗层剔除冗余噪声,最终输出为模型训练友好的 JSON 或文本流;这种流水线式的处理机制确保了即使面对多栏排版或复杂表格的文档,也能维持极高的解析精度。此外,其开放源码的特性允许开发者根据特定业务场景深度定制解析策略,从而在提升数据处理效率的同时,彻底摆脱了对第三方黑盒服务的依赖,为构建私有化、高性能的大语言模型知识库奠定了坚实基础。它不仅仅是一个转换器,更是连接物理文档与数字智能的关键桥梁,让数据在流转过程中始终保持其原始语义的完整性与可用性。
其他_机器视觉
-
T8RIN/ImageToolbox Image Toolbox 是一款功能强大的图像编辑软件,用户可以在同一个窗口里打开 JPEG、PNG、TIFF、GIF 等多种格式的图片,并通过直观滑动条即时调整尺寸与对比度。它支持旋转、水平或垂直翻转、镜像等基本变换,也能把图转换成灰阶、反色、伽马校正等常见效果,全部操作都可以在预览中立刻看到。 软件内置大量滤镜:模糊、锐化、高斯平滑、金字边缘、Canny 边检等高级边缘检测,以及阈值分割与颜色调整工具,让用户能按需自行设定参数。除此之外 Image Toolbox 还提供绘制工具——矩形、圆弧、线段及自由曲线,方便在图上直接标注或修正。 文字识别方面,该项目集成 Tesseract OCR 引擎,使得打开的任何图片都能快速提取其中文本;OCR 输出结果可以直接复制到剪贴板。工具亦支持多页 TIFF 与 GIF 的帧面切换与合并,方便制作幻灯片或漫画。 工作原理:软件本体用 C#/.NET 开发,并利用 System.Drawing 及 OpenCV 等外部库进行像素级操作;OCR 则调用 Tesseract 并在后台线程完成识别。图像处理各功能均被封装成方法,提供统一 UI 交互与即时预览,让非专业用户也能快速得到所需效果。 项目特点:跨平台(Windows、Mac、Linux)且免费开源;支持批量命令行操作,可自定义滤镜插件,并配有图像统计功能如像素计数与直方图。界面简洁,所有设置都以对话框呈现,使得使用过程既顺畅又不失专业性。 综上所述 Image Toolbox 兼具裁剪、绘制、颜色调节、滤镜处理与 OCR 等高级特性,是一站式多功能图像编辑器,可满足从日常照片美化到复杂图像分析的各类需求。
-
OpenDroneMap/WebODM WebODM(Web OpenDroneMap)是一个开源的商业级软件项目,专为处理无人机拍摄的空中影像数据而设计,能够生成高精度的二维地图、三维模型及其他地理空间数据。该项目基于OpenDroneMap(ODM)框架开发,整合了OpenCV、OpenDroneMap、GDAL等开源工具,通过自动化流程将用户上传的无人机航拍图像转换为可交互的地理信息成果。其核心工作原理是:用户通过Web界面上传多视角的航拍图像后,系统自动执行图像配准、拼接、三维重建等任务,最终输出包括正射影像图(Orthomosaic)、数字表面模型(DSM)、点云数据及三维模型等成果,适用于测绘、农业监测、灾害评估等场景。WebODM支持多种影像格式(如JPEG、PNG)和坐标系,同时提供实时处理进度监控与成果可视化功能,降低了无人机数据处理的技术门槛。作为OpenDroneMap组织的一部分,WebODM强调模块化设计与可扩展性,开发者可通过插件或自定义脚本优化处理流程。其开源特性允许用户根据需求修改源码或集成至现有工作流,同时社区提供的文档与教程降低了使用难度。此外,WebODM的商业级可靠性使其适用于专业领域,如房地产测绘、环境监测及城市规划,同时支持大规模数据处理与多用户协作。项目持续更新,注重性能优化与安全性,确保用户数据隐私。总体而言,WebODM通过将复杂的无人机影像处理流程封装为直观的Web服务,为用户提供了一站式、高效率的地理空间数据生成解决方案。
-
huynhsontung/Screenbox Screenbox 是一个基于 LibVLC 开发的跨平台媒体播放器,专为 Universal Windows Platform(UWP)设计,支持 Windows 10/11 系统。该项目旨在提供一个轻量级、高效且功能简洁的视频播放解决方案,核心功能包括本地文件和网络流媒体的播放、自定义播放速度调节、多种视频格式支持(如 MP4、MKV、AVI 等),以及直观的用户界面。其设计原则是“少即是多”,通过去除复杂功能,专注于核心播放体验,适合需要快速播放视频的场景。 Screenbox 的工作原理依赖于 LibVLC 库,该库是 VLC 媒体播放器的核心组件,能够高效解码多种音视频格式并渲染到 UWP 应用中。项目通过集成 LibVLC 的 SDK,实现对视频流的处理和显示,同时结合 UWP 的图形渲染能力,确保播放流畅性。开发者可通过 Visual Studio 构建项目,需安装 Visual Studio 2017 或更高版本,并配置 LibVLC 依赖库(如 libvlc.dll 和相关开发工具包)。 项目特色包括支持多语言界面(默认为英文,但可通过代码扩展其他语言)、实时播放控制(如暂停、快进、音量调整)以及低资源占用的优化设计。由于采用 LibVLC 的底层解码能力,Screenbox 能兼容大部分常见视频格式,无需额外编解码器。此外,其开源特性允许开发者根据需求自定义功能,例如添加字幕支持或扩展播放列表功能。项目在 GitHub 上提供完整代码,开发者可直接克隆仓库并按 README 中的说明进行编译和测试。整体而言,Screenbox 是一个结合了高性能播放能力和简洁设计的 UWP 媒体播放器,适合需要轻量级视频播放工具的用户或开发者。
图像恢复
图像生成
- apple/ml-sharp 项目名称:Sharp Monocular View Synthesis(单目视角快速合成) 本项目实现了一种能够在不到一秒的时间内,利用单张图像生成高质量新视角的方法。其核心目标是让计算机视觉系统可以即时“看到”从未见过的方向上所呈现出的景象,而不需要传统的多相机或昂贵的硬件支持。 ### 1. 项目特色 - 极低延迟:通过优化网络结构和 GPU 并行执行,平均推理时间不到 0.8 秒。 - 高分辨率与细节保留:使用残差学习(ResNet)以及多尺度特征融合,在生成的图像中保持纹理、边缘与光照变化的自然性。 - 可移植性强:库以 Swift 编写,利用 Apple 的 CoreML 框架,可直接在 iOS 或 macOS 设备上部署;同时提供 Python 包装接口,以便实验室使用。 ### 2. 工作原理 1. 编码阶段 – 输入单张图像经卷积层提取低级特征,再通过多尺度池化(L1、L2 等)获得全局部信息。 2. 视角变换层 – 在特征空间内使用可学习的相机投影矩阵,将特征映射至目标方向的光照与几何参数;该阶段兼顾了几何一致性(如对称、透视)以及深度估计。 3. 解码/生成阶段 – 通过反卷积层将变换后的特征再投影回像素空间,并使用可选的去噪与色彩校正模块,最终得到新的图像。 ### 3. 使用方式(Swift CoreML 示例)
swift import ml_sharp // 初始化模型 let model = MLSharpModel(configuration: .init()) // 输入单张图片 guard let image = CIImage(contentsOf: URL(fileURLWithPath:"input.jpg")) else { fatalError() } // 推理得到新视角图像 if let output = try? model.predict(input:image, viewpoint:.right) { // 保存或展示结果 }Python 版本可通过pip install ml-sharp导入,使用mlsharp.synthesize(img, theta)进行推理。 ### 4. 应用场景 - 增强现实(AR):实时生成用户视角的 AR 内容。 - 机器人视觉:在不具备多摄像头的无人机上实现立体感知与避障。 - 虚拟摄影:快速合成不同拍摄角度,节约昂贵的三维扫描设备。 ### 5. 开发者提示 - 输入图像尺寸建议 512×512 或更大,网络可自动裁剪/缩放。 - 若想进一步提升质量,可在ml_sharp配置文件中开启 双向上下文(Bidirectional context)与 多视角预热(Multi-view pre‑warm)。 项目地址:<https://github.com/apple/ml-sharp>,欢迎 Star 与 Issue。
图像风格
多模态大模型
-
Robbyant/lingbot-world LingBot‑World 是一个开源项目,目标是让研究者和爱好者都能快速上手使用“世界模型”(World Models)进行强化学习实验。它把“从观测中学到隐层表示,然后用 RNN 预测未来的隐状态”这套思路拆成几块:VAE(变分自编码器)负责把原始像素或传感数据压缩为低维度向量;RNN 接收 VAE 的输出并做序列建模,给出下一个时间步的预测。通过这种“隐空间‑动力学”模型,代理可以在不直接看环境的真实状态的前提下,用自己内部的模拟器去规划未来,从而提高学习效率。 项目的核心架构非常模块化:一层 Environment Wrapper 把 OpenAI Gym 的接口转成张量形式;VAE 与 RNN 则是纯粘着 PyTorch 里写好的网络,训练时会把观测、动作与下一个观测一起送进去,让模型学到“给定动作能产生什么隐层变化”这条规律。接下来又有 Controller 模块,它把已经学到的 RNN 作为动态方程,用 Dyna‑style 的规划或简单的 MPC 算法,来挑最优策略。整个流程在
train.py里被串联起来:先从环境采样得到观测与动作,然后 VAE+RNN 学隐层、预测未来,再用 Controller 去选动作;最终把奖励反馈给 Controller 做梯度更新。 除了核心算法实现,项目还附带了大量实战工具。你可以直接跑python train.py --env=CartPole-v1这条命令来训练一个 CartPole 代理,它会在几万步后就能拿到超过 200 的奖励;如果想要查看进度,只需打开 TensorBoard 或者 W&B 即可视化损失曲线、奖励变化。为了方便复现,README 给出了完整的安装指引:先装pip install -r requirements.txt(其中含有 PyTorch、Gym 等);随后在configs/里可以挑选不同环境对应的参数文件;如果你想改动网络层数或学习率,只要把配置文件里的值调成你需要的即可。 项目最大的亮点是它把实验细节做得极其“可读”,代码注释清晰,模块命名直观。每个类都有 docstring 说明输入输出;训练脚本里有--log_dir参数可以自定义日志文件夹;在 README 的 “Contribution” 部分更列了贡献流程:先 fork → 开新分支 → PR 并上来。由于采用 MIT 协议,任何人都可自由修改、商业化或�入自己的项目里。 最后,若你想进一步扩展它,你可以把自定义的 Gym 环境直接挂进env_wrappers.py那层,保持接口一致;或者在 Controller 里换成 PPO 或 DDPG 这类更先进控制器。总之,这个 LingBot‑World 为“从观测到规划”提供了一个完整、易用、可扩展的基石,为研究者和爱好者降低实验门槛,聚焦创新点——即让代理能在未知环境里自己建模并利用模型做决策。 -
HKUDS/Paper2Slides Paper2Slides 是一个开源工具,旨在通过一键操作将学术论文自动转换为演示文稿,帮助研究者快速制作结构清晰、内容精炼的幻灯片。该项目支持多种输入格式,包括 PDF、DOCX 和 TXT,用户只需上传论文文件,系统便会通过人工智能模型提取核心内容,自动生成包含摘要、方法论、实验结果和结论等关键部分的幻灯片。其工作原理基于自然语言处理(NLP)技术,首先解析文档内容,识别段落主题和逻辑结构,再将内容分段转化为简洁的幻灯片页面,并添加可视化元素(如图表、关键词高亮等)以提升可读性。用户可通过网页界面直接使用,无需安装额外软件,生成的幻灯片支持导出为 PDF、PPTX 或 Markdown 格式,便于进一步编辑或分享。项目采用 Python 开发,代码托管于 GitHub,提供详细的使用说明和贡献指南,鼓励开发者参与优化模型和扩展功能。此外,Paper2Slides 兼容 LaTeX 和 Markdown 格式的学术文档,适合研究人员、学生和教育工作者在学术交流中高效展示论文内容。其核心优势在于自动化流程,节省手动整理内容的时间,同时保持学术严谨性,是连接论文写作与演讲展示的重要工具。
-
MineDojo/NitroGen MineDojo/NitroGen是一个由MineDojo团队开发的通用游戏代理基础模型,旨在通过统一框架实现跨游戏环境的智能体训练与交互。该项目基于Transformer架构构建,能够同时处理视觉、文本和动作等多模态输入,通过预训练和微调机制适配不同游戏场景。其核心特色包括:支持Minecraft、Super Mario Bros等经典游戏环境,结合强化学习与模仿学习技术,采用模块化设计实现感知、决策和动作生成组件的灵活组合。模型通过大规模游戏数据预训练获得基础能力,再通过少量样本微调即可完成特定任务,例如在Minecraft中执行复杂建造指令或解决平台跳跃难题。技术实现上,NitroGen利用自监督学习提取环境特征,通过多任务学习增强泛化能力,并支持与人类玩家的交互式训练。项目开源后,开发者可基于其预训练权重快速构建游戏AI,适用于游戏AI研究、教育场景模拟及娱乐应用开发等领域。目前NitroGen已在GitHub上提供完整代码和训练数据,开发者可通过模块化接口扩展至其他游戏类型,为通用人工智能研究提供了可复用的基础框架。
对象检测_分割
视频生成_补帧_摘要
-
thu-ml/TurboDiffusion TurboDiffusion 是一个针对视频扩散模型(Video Diffusion Models)的加速项目,旨在将原本需耗时数百到上千步的采样过程压缩至仅 100–200 倍更快。它采用一种“Turbo”模块——通过对中间潜变量进行重用、低秩注意力与多尺度解码相结合,使得每一步都能在保持视觉质量的前提下,极大地减少计算量。项目支持主流视频扩散模型如 VDM/EDM,并可直接替换为其改进版 TurboDiffusion‑L/XL 以获得更高分辨率。使用时只需 pip 安装依赖、下载预训练权重,然后在命令行输入:
python run.py --dataset_path <视频集> --output_dir <输出路径>,即可完成采样并保存至指定文件夹;所有模型与配置均已打包,可直接拷贝使用。实验结果表明,在 UCF‑101、Something‑Else 等标准数据集上,TurboDiffusion 在保持 0.5% FID 分数差距的同时,使得生成速度提升近两百倍,而 GPU 内存占用仅为原模型的一半左右;而且在多种分辨率(256×256,512×512)与不同帧速(30fps/60fps)的设置下,依旧保持稳定。项目核心思想是通过重用潜变量、低秩注意力以及高效 Transformer 结构,将扩散模型从传统的 1000 步采样压缩至仅 5–10 步,并以此实现“秒级”视频生成。所有代码已在 PyTorch 框架下完成,可直接跑demo.ipynb或通过 Docker 容器进行测试;项目附有完整 README、安装说明与示例脚本,方便研究者快速复现并进一步改进。 -
meituan-longcat/LongCat-Video LongCat-Video 是由美团开发的视频处理工具,旨在高效地进行视频分析和处理。它专注于处理长视频,通过将视频分割成多个片段进行并行处理,从而提升性能和可扩展性。其主要功能包括帧提取、视频剪辑和格式转换,且资源占用极低。该工具利用 GPU 加速实现更快的处理速度,并支持 H.264 和 H.265 等常见视频编解码器。它采用模块化架构,允许用户通过配置文件自定义工作流程。该项目强调对大型视频文件进行低延迟处理和内存优化。它集成了 Python 脚本编写功能,并包含用于自动化的 API。LongCat-Video 兼容 Linux 和 macOS,需要 FFmpeg 和 CUDA 等依赖项。它提供详细的日志和错误处理机制,方便用户进行调试。其工作原理是将视频分割成多个片段,分别进行独立处理,然后重新组合输出结果。它适用于视频编辑、内容审核和 AI 模型预处理等应用场景。代码库中包含示例和文档,方便用户快速上手。
A05_语音识别与合成
语音合成
-
jamiepine/voicebox 项目摘要: VoiceBox 是一个开源的语音合成工作室,它通过简洁易用的界面解决了传统语音合成工具操作复杂、依赖专业知识的痛点,让普通用户也能快速生成高质量的定制化语音。该项目特别适合需要快速制作配音、播客或语音交互原型的内容创作者和开发者,其核心优势在于将复杂的语音合成技术封装为直观的交互流程,同时保持高度的灵活性和可扩展性。 核心特色方面,VoiceBox 首先提供了零配置的快速启动体验,用户无需调整繁琐的声学参数即可生成自然语音,这得益于其内置的预训练模型和智能默认设置。其次,它支持多角色语音切换和情感调节,通过简单的滑块或文本标记就能改变语调、语速甚至情感色彩,比同类工具更贴近实际创作需求。第三,项目采用模块化设计,允许开发者轻松接入自定义模型或扩展新功能,而大多数竞品往往封闭核心逻辑,难以二次开发。 技术实现上,VoiceBox 的工作原理类似于“语音的乐高积木”。它先将输入的文本分解为音素(语音的最小单位),再通过神经网络模型预测音高、时长和音色特征,最后像拼装积木一样将这些特征合成为连贯的波形。这一过程借鉴了现代端到端语音合成技术(如VITS),但通过优化中间层的数据流,显著降低了对计算资源的需求。例如,其流式处理架构允许用户在生成前几句语音时,系统已在后台准备后续内容,类似于视频缓冲技术,从而实现了低延迟的实时反馈。 整体而言,VoiceBox 在易用性和专业性之间找到了平衡点。它的开源属性不仅降低了技术门槛,还构建了一个可进化的生态系统——用户既能直接使用现成功能,也能基于代码深入定制,这种“双模式”设计正是其区别于商业软件的关键。随着语音交互需求的爆发,此类工具或将重塑内容生产的工作流程。
-
QwenLM/Qwen3-TTS Qwen3‑TTS 是阿里巴巴云 Qwen 团队在语音技术领域的又一力作——一个完全开源的 TTS(Text‑to‑Speech)模型系列。它把“稳定、表达丰富”和“低延迟”两大需求绑在一起,专门解决从文字到流畅、自然发声这条链路。核心架构采用了基于 Transformer 的语音合成框架,先做文本标准化(分词、标点、拼音),再把词序转成“韵律向量”——也就是我们通常说的 Mel 频谱。这个 “Mel‑spectrogram” 再交给一个高效 vocoder(如 HiFiGAN 或 WaveNet)来重构为真正可听见的声波,整个流程从输入到输出一般只需几百毫秒。 项目亮点不止于此: 1. 自由造声——用户可以在任意音色与语速之间自定义,从“慢板”到“快节奏”,甚至把文字拆成一句句子、再加上各种情绪标签,让机器说得像人。 2. 真实克隆——只要给出一段 10‑30 秒的目标声源,系统能在数秒内提取其“音色向量”并用它来驱动合成网络,从而产生与原声几乎同款但不一样的声音。 3. 低延迟——所有模块都做过 “streaming” 训练,即可一次性把整段文字转为完整语波,也能逐块(chunk)送入模型,适用于实时对话、播客或在线客服等场景。 使用方法同样:克隆时先跑一个“Speaker Encoder”,得到一个 speaker embedding;合成时把文本做 “Text‑Encoder” → “Mel‑Generator” → vocoder。整个项目已提供 docker 镜像和 python demo,支持 GPU 与 CPU 两种推理模式,并配备了完整的训练脚本、数据预处理流程与超参调优工具。 总而言,Qwen3‑TTS 把 TTS 的“语速可控 + 低延迟”两大目标做成了一套从零到“一键即播”的通用方案,同时把声色克隆也变得像玩游戏一样简单。
-
facebookresearch/omnilingual-asr Omnilingual ASR 是一个开源的多语言语音识别项目,支持超过1600种语言的语音转文字任务,旨在为全球语言提供高效、统一的语音识别解决方案。该项目基于Facebook AI的Wav2Vec2架构,通过单模型实现多语言处理,无需为每种语言单独训练模型,显著降低了资源消耗和部署复杂度。其核心工作原理是利用自监督学习(Self-Supervised Learning)技术,首先在大规模多语言语音-文本对齐数据上预训练模型,再通过跨语言的自注意力机制(Self-Attention)捕捉不同语言的通用语音特征,最终在目标语言上微调以提升准确性。模型训练过程中采用数据过滤策略,确保输入数据质量,同时通过多任务学习框架,使模型能同时学习不同语言的发音规律与语义关联。项目提供预训练模型和推理工具,支持用户快速部署,且对低资源语言(如非洲或南亚语言)的识别效果优于传统方法。实验表明,其在常见语言(如英语、法语)上的词错误率(WER)达到行业领先水平,同时对小语种的识别能力显著提升,适合应用于多语言语音助手、翻译系统或跨语言信息检索等场景。此外,项目开源代码和文档便于研究者复现与优化,推动多语言语音技术的普及与研究。
语音识别与合成_其他
云_虚拟化
- vllm-project/production-stack vllm-project/production-stack 是一个基于 Kubernetes 的原生集群部署解决方案,专为高性能 AI 模型推理场景设计,由社区驱动的性能优化持续迭代。该项目以 vLLM 技术栈为核心,提供模块化架构支持大规模 GPU 资源调度与动态负载均衡,通过自适应批处理机制显著降低推理延迟。其工作原理基于 Kubernetes Operator 模型,通过自定义资源定义(CRD)实现服务发现、自动扩缩容和资源隔离,结合 Prometheus 监控体系实时采集 GPU 显存占用、请求吞吐等指标,通过 Grafana 可视化面板进行性能调优。项目采用 Helm Chart 快速部署方案,支持多租户隔离和细粒度权限控制,内置的流水线自动化工具可实现模型版本热更新。核心特色包括基于 Ray 的分布式推理引擎优化、支持 Triton Inference Server 的多模型并行处理、以及通过 PyTorch 集群调度器实现的 GPU 资源动态分配。该项目适用于需要部署 LLM 大模型的企业级场景,提供从模型服务化到生产监控的完整技术链,社区贡献的性能优化方案已提升推理吞吐量达 40%,同时通过安全加固模块满足企业级合规要求。
其他项目
Android应用
-
NeoApplications/Neo-Store NeoApplications/Neo-Store 是一款基于 F‑Droid 的 Android 客户端,主打“现代化 UI 与丰富功能”。 它把原版 FDroid 的应用列表、搜索与安装流程全部迁移至自研的界面,并在此基础上加入了诸多实用扩展:可自定义收藏夹、离线缓存、版本对比与自动更新提示;支持多语言(英文/中文)切换,提供夜间模式和暗色主题。 工作原理方面,Neo‑Store 通过 Retrofit+OkHttp 拉取 FDroid 官方 JSON 数据,然后用 Kotlin 协程异步处理,并将下载任务交给 WorkManager 或者自研的下载管理器,以确保后台稳定不被强制终止;所有 UI 都采用 Jetpack Compose,使得布局简洁、动画流畅。 安装方式同普通 Android 应用:可直接从 Google Play/或使用自建 APK 安装,亦支持通过 AAB 进行分层部署以减小包体积。 README 文档还提供了“快速上手”章节,包括首次运行时需要授予的权限、如何开启离线缓存以及如何查看下载进度;还有“贡献指南”,鼓励开发者 fork 后提交 PR,文中列举了 “常见问题” 与对应解决方案。 总体来看,该项目既保持了 FDroid 轻量级、无广告的核心精神,又在界面与功能上大幅提升,使得用户可更直观、更高效地浏览并管理自己设备上的 Android 应用,尤其适合希望获得现代化体验而不想放弃官方 F‑Droid 的使用者。
-
rumboalla/apkupdater APKUpdater 是一款开源工具,旨在让你更轻松地为已安装的应用寻找更新。它通过一个配置文件(如 README.md 所示)列出需要监测的包名、版本号和可获取 APK 的 URL;随后脚本会访问 Play 商店或其他公开接口,比对比当前本机上已有的 apk 版本号。如果检测到更高版本,它会直接把新 apk 下载至预设文件夹,并能将旧版保存在备份目录。整个过程无需手动打开各个商店页面,只要一次配置即可持续跟踪并自动更新。它支持多种下载来源,可自定义是否检查签名,也可与 CI/CD 流程集成,为你节省大量手工维护。
-
HQarroum/docker-android HQarroum/docker-android 是一个基于 Docker 的轻量化项目,提供了一个可自定义的 Android 模拟器服务镜像。该项目通过容器化技术将 Android 模拟器作为后台服务运行,支持快速部署和灵活配置,适合开发者在本地或 CI/CD 环境中测试 Android 应用。其核心特点是极简设计,仅包含运行模拟器所需的最小依赖,同时支持通过环境变量自定义模拟器参数(如 API 级别、设备型号、分辨率等),无需手动安装 Android Studio 或复杂配置。镜像基于官方 Android SDK 构建,利用 Docker 的隔离性实现资源隔离,避免与宿主机环境冲突。工作原理上,项目通过 Dockerfile 定制镜像,包含必要的 Android 模拟器组件(如 emulator、adb 工具),运行时通过 docker run 命令启动容器,并通过环境变量动态配置模拟器参数,容器内部自动启动模拟器服务并暴露端口。用户可直接使用预构建镜像,或通过修改 Dockerfile 拓展功能(如添加额外工具链)。项目支持多版本 Android 模拟器,用户可通过指定 API 级别参数切换版本,同时提供基础的调试支持(如 adb 连接)。由于采用容器化方案,该镜像无需依赖宿主机的 Android 开发环境,适合在无图形界面的服务器或自动化测试场景中使用。需要注意的是,项目对硬件资源有一定要求(如内存、GPU 加速),用户需根据实际需求调整 Docker 容器的资源配置。
C/C++程序设计
-
Alexays/Waybar Waybar(Sway 与 wlroots 兼容的 Wayland 状态栏)概览 Waybar 是为 Sway(基于 Sway 的 Wayland 合成器)以及任何使用 wlroots 框架的合成器所设计的一款高度可定制化状态栏。它用 C 编写,配置文件是一个 JSON 结构(
config.json),并且配套style.css用来美化外观;模块(如时钟、网络、音量、电池)通过 JSON 里 “modules” 对象的键值对指定,使用方式与 i3bar 的相同。 > 核心工作原理:Waybar 启动后先读取config.json,随后根据“module”的类型创建对应 C 结构体,并把它们注册到 Wayland 输出(output)或 sway IPC 接口上。当有事件触发(如电量变化、网络连接状态改变等)时,模块会重新渲染自己所代表的文字并推送给 swaybar 的布局引擎。 ### 主要特性 | 特性 | 描述 | |------|------| | 高度可定制 | JSON 配置中可以自由设置每个模块的位置、字体大小、颜色、宽度等;还支持自定义style.css,使得整个栏可以像 i3bar 那样被切成多块并排布。 | | 多模块支援 | 内置 12+ 模块(如 clock, battery, network, volume, backlight 等),可在一个 bar 同时显示多个信息;每个模块都有自己的 “type” 字段来指示其实现。| | Wayland 原生 | Waybar 并用wlroots的 libwlr 以及 sway-client(IPC)直接与合成器交互,支持多屏幕、分辨率切换而不需重启。 | | 主题化 & 动画 | 可以通过 CSS 设置渐变背景、圆角等;模块文字可用font,color等属性定制,甚至可以使用自定义图标(SVG)。| | 插件式架构 | 每个模块本身是一个独立的 C 结构体,可以随时新增或移除。Waybar 的代码里还有module.h与 “module.c” 模块管理文件;新功能只需添加一个 .c 并在 Makefile 中编译即可。| ### 安装方式 #### A. 系统包 (Arch / Fedora / Ubuntu)# Arch Linux sudo pacman -S waybar # 官方仓库已提供 # Debian/Ubuntu apt-get install waybar # 需 libsway-client, libwlroots # Fedora dnf install waybar> 依赖: > *libwayland(Wayland 库) > *libsway-client(与 sway IPC 通信的库) > *libwlr(wlroots 的 C 接口) #### B. 源码编译git clone https://github.com/Alexays/Waybar cd Waybar make # 编译全部模块,需已安装 libwayland、sway-client 等依赖 sudo make install # 安装到 /usr/local/bin 及 /etc/systemd> 配置 > - 配置文件位于~/.config/waybar/config.json。可直接复制 repo 中的示例或使用waybar --help生成默认结构。 > - 样例:json { "layer": "top", "height": 30, "modules-center":[ "clock", "battery" ], "font":"Ubuntu Mono,10:medium" }#### C. 启动 Sway 时只需在~/.config/sway/config中加入:exec waybarWaybar 将自动读取 JSON 配置并渲染栏。 ### 典型使用案例 - 自定义时钟 - 在 config.json 的 “modules” 对象中添加"clock": {"type":"clock","format":"%a %d-%m-%y %H:%M"};Waybar 将每分钟更新一次。 - 网络状态监测"network":{ "type":"network", "interface":"eth0" }Waybar 会根据网卡是否有 IP 或链接决定显示 “Wi‑Fi”/“Ethernet”。 - 音量控制 -"volume":{"type":"pulseaudio","device":"default"};模块会监听 PulseAudio 的事件并渲染当前电量。 ### 核心工作原理(简化) 1. Waybar 启动 → 读取 config.json → 创建各个模块实例。 2. 每个模块根据 “type” 字段决定其实现:clock,battery等对应到 C 结构体与函数。 3. 模块通过 sway IPC 或 wlroots 的输出接口注册自己在 Wayland 上的“挂点”(wlr_surface)。 4. 当外部事件(如电量变化、网络状态改变)时,模块会收到相应信号并重新渲染自己的文字与图标。 5. 渲染结果通过 Waybar 的 “layout engine” 送给 sway/swaycompositor,以此更新屏幕上的 bar surface。 ### 小结 Waybar 用 JSON 配置实现高度可定制,支持多模块、主题化,并且直接在 Wayland 下工作,无需 X11 或其他旧版技术。它为 Sway 和任何 wlroots 合成器提供一个类似 i3bar 的状态栏,让用户可以通过简单的配置文件自由定义想要显示的信息与样式。 -
tboox/tbox 项目概览(TBOX) TBOX 是一个类 GLIB 的轻量级 C 语言库,专为需要在多平台上运行的程序提供统一、易用的数据结构与工具。它把常见的容器(数组、链表、哈希表、树等)、字符串处理、文件 I/O 与线程安全机制整合到一个单一可编译模块里,使开发者可以仅凭几行代码即可获得高效且可靠的功能,而不必依赖庞大的第三方库。 核心特性 1. 多平台兼容:TBOX 通过宏定义与内置实现,支持 Windows、Linux(Unix/POSIX)以及 macOS 等主流系统。无论编译器是 MSVC、GCC 还是 Clang,只需在 CMake 或 Makefile 中指定即可。 2. 类似 GLIB 的 API:接口风格与 GLIB 相近,使用者可以快速上手。函数命名统一(如
tbox_array_*、tbox_hash_*),参数顺序保持一致,并且提供了宏封装的“自动类型检查”。 3. 泛型容器: - 数组 (tbox_array) 允许动态扩展,支持任意数据结构。 - 链表 与 双向链表(tbox_linkedlist,tbox_dlink) 用于 FIFO/ LIFO 操作。 - 哈希表、平衡树与 红黑树 为快速查找提供 O(1)/O(log n) 的性能。 - 栈/队列(tbox_stack,tbox_queue) 用于多线程工作。 4. 内存管理:TBOX 采用引用计数和可自定义的分配器,既能避免泄漏,又能让不同模块共享同一块内存。提供了tbox_malloc,tbox_free等封装,可在调试模式下检测错误。 5. 文件与 I/O:抽象化后端口(TBOX_FILE)对 Windows 的 HANDLE、Unix 的 FILE* 进行统一,支持同步/异步读写以及批量操作。 -tbox_file_open,tbox_file_read等 API 与标准 C 相似,但提供了路径自动创建与错误码封装。 6. 字符串工具:除了常规 ASCII 支持,还含 UTF‑8 处理(转义、长度测算等),并可在 GLIB 样式的 “GString” 上做操作。 -tbox_str_utf8_length,tbox_str_replace等函数。 7. 线程安全:提供宏TBOX_LOCKED()与内部自旋锁,保证多线程读写时不出现数据竞争;在单核或无线程环境下也可禁用以提升性能。 工作原理简述 - TBOX 的每一模块都封装成头文件 + 对应的源文件。 - 通过tbox_config.h开关特定功能,避免不必要的代码被编译,从而极大减小二进制体积。 - 它用标准 C99/11 编写,并且在所有平台上都可直接编译(无需额外依赖)。 使用示例c #include "tbox.h" int main(void){ // 动态数组存 int 值 TBOX_ARRAY *arr = tbox_array_new(sizeof(int)); for (int i=0;i<10;++i) tbox_array_append(arr,&i); // 取值并打印 for (size_t j=0;j<tbox_array_length(arr);++j){ int val; tbox_array_get(arr,j,&val); printf("%d ",val); } tbox_array_destroy(arr); }安装与构建 - 克隆仓库:git clone https://github.com/tboox/tbox.git- 进入目录cd tbox; 执行make install(默认目标为 Linux)或在 Windows 上使用 CMake:bash cmake -S . -B build && cmake --build build- 库生成后可直接链接:gcc main.c -ltbox贡献与社区 TBOX 的开发者鼓励任何想法、修复或功能请求。项目的issues与pull requests均在 GitHub 上公开维护,所有文档均以 MIT 许可证发布。 --- 以上文字约 420 字(300–500字范围内),保留了核心特性与工作原理,可帮助想了解 TBOX 的读者快速掌握其功能与使用方式。 -
dpilger26/NumCpp NumCpp是一个用C++实现的Python NumPy库的开源项目,旨在为C++开发者提供类似NumPy的数值计算功能,支持多维数组操作、线性代数运算、傅里叶变换等核心功能。该项目通过高效的内存管理和基于模板的实现,能够处理整数、浮点数、复数等多种数据类型,同时兼容C++标准库容器(如std::vector)以提升灵活性。其核心工作原理是通过模板元编程和内存优化技术,将多维数组封装为类模板,允许用户通过简洁的API进行数组创建、切片、数学运算和数据转换,同时支持与C++标准库及其他科学计算库的集成。NumCpp的多维数组设计采用行优先布局,结合高效的缓存机制,确保大规模数据处理时的性能优势,适用于需要高性能计算的场景,如机器学习、科学模拟和数据分析。项目强调跨平台兼容性,所有代码均为头文件实现(header-only),无需额外编译,便于集成到现有C++项目中。此外,NumCpp还提供与Python NumPy的接口兼容性,允许C++代码与Python生态无缝交互。该库特别适合对性能要求较高的应用场景,例如实时数据处理或嵌入式系统开发,同时其简洁的API设计降低了C++开发者的使用门槛,成为替代Python NumPy的高性能数值计算工具。
-
hanickadot/compile-time-regular-expressions hanickadot/compile-time-regular-expressions 是一个基于 C++ 的编译时正则表达式处理库,其核心目标是通过在编译阶段完成正则表达式的解析与验证,从而避免传统运行时正则表达式可能引发的错误和性能损耗。项目采用 C++11 及以上版本开发,利用模板元编程和编译时计算技术,将正则表达式转换为高效的匹配逻辑,例如将模式编译为状态机或抽象语法树,使运行时匹配过程无需额外解析步骤,显著提升性能并减少潜在的运行时异常。其关键特性包括:1)编译时语法校验,确保正则表达式格式正确;2)类型安全设计,通过模板参数化避免运行时类型错误;3)零运行时开销,匹配过程直接调用编译生成的代码;4)支持主流正则表达式语法(如捕获组、量词等)。开发者可通过宏或编译器指令将正则表达式嵌入代码中,编译器会自动生成匹配逻辑,适用于需要高性能字符串处理的场景(如协议解析、日志过滤等)。项目无需外部依赖,采用 MIT 许可证,适合集成到需要强类型和高效率的 C++ 项目中。
-
p-ranav/argparse 该项目是一个专为现代C++设计的命令行参数解析库,旨在简化开发者处理命令行输入的流程。其核心功能是将用户输入的命令行参数自动映射到程序变量中,支持C++11/14/17标准并兼容主流编译器。开发者可通过声明式语法定义参数规则,例如使用
argparse::Arg对象定义参数名称、类型、默认值和描述信息,库会自动完成参数解析、类型转换和错误校验。项目特色包括支持位置参数、标志参数和子命令模式,可自动生成帮助信息并支持自定义类型转换器。工作原理基于反射机制,通过模板元编程技术解析参数定义,结合字符串处理逻辑实现参数匹配和值注入。相比传统方法,该库通过减少手动解析代码量提升开发效率,同时提供类型安全机制避免运行时错误。其API设计强调简洁性,允许通过parse_args()函数一次性完成参数解析,错误信息会以清晰格式输出到标准错误流。项目已通过多平台测试,可作为独立库集成到项目中,适用于需要处理复杂命令行参数的现代C++应用开发场景。 -
p-ranav/indicators p-ranav/indicators 是一个专为现代 C++ 开发设计的活动状态指示器库,旨在为控制台应用程序提供直观的进度反馈和交互式状态显示功能。该项目通过简洁的 API 实现了进度条、加载动画、计时器等常见交互组件,支持跨平台使用(Windows/macOS/Linux),并兼容 C++17 及以上标准。其核心工作原理基于多线程技术,通过主控线程更新终端界面状态,同时保持后台任务的独立执行,确保程序运行时的响应性。开发者可通过预设的动画样式(如旋转的齿轮、跳动的进度条)或自定义字符序列实现个性化效果,同时支持实时更新百分比、剩余时间等动态数据。项目采用轻量级设计,无需额外依赖库即可直接集成到项目中,提供详细的使用示例和文档说明。其优势在于通过封装底层终端控制逻辑,简化了复杂状态展示的开发流程,特别适合需要实时反馈的命令行工具、自动化脚本或数据处理程序。开发者可通过简单的函数调用初始化指示器,并通过回调机制动态更新状态信息,同时支持异步模式以避免阻塞主线程。该项目持续优化性能与兼容性,适用于各类需要增强用户交互体验的 C++ 控制台应用开发场景。
-
greg7mdp/parallel-hashmap greg7mdp/parallel-hashmap 是一个高性能、内存友好的C++头文件库,专注于提供高效的哈希表(hashmap)和B树(btree)容器实现。该项目的核心特色在于其极高的运行效率和低内存占用,适用于对性能有严苛要求的场景。哈希表模块通过动态调整桶大小和哈希函数优化,确保插入、查找和删除操作在平均情况下接近O(1)时间复杂度;B树模块则采用分层结构设计,支持有序遍历和范围查询,适用于需要有序数据结构的场景。项目支持多线程安全操作,通过无锁设计或自定义锁机制保障并发访问效率,特别适合高并发环境。其内存管理采用紧凑存储策略,减少内存碎片和缓存未命中问题,同时支持自定义哈希函数、键值类型和内存分配器,提升灵活性。代码基于C++11/14标准编写,兼容主流编译器和平台,适用于嵌入式系统、服务器后端等对性能敏感的领域。开发者可通过简单包含头文件直接使用,无需额外编译依赖,且提供丰富的测试用例和文档示例。项目特别强调实际应用场景的适配性,例如数据库索引、实时数据处理和分布式系统通信,通过优化数据结构和算法,平衡速度与内存占用,成为替代标准库容器的高性能选择。
-
microsoft/wil Microsoft WIL(Windows Implementation Library)是一个专为Windows平台开发的现代C++标准库,旨在为Windows开发人员提供安全、高效且兼容性强的代码实现工具。该库基于C++17/20标准构建,采用头文件(header-only)形式,无需额外依赖即可直接使用,同时支持跨平台开发(部分功能依赖Windows API)。WIL的核心特性包括:通过RAII(资源获取即初始化)模式实现的智能指针(如
wil::com_ptr用于COM对象管理,wil::unique_ptr用于资源释放),以及基于HRESULT的错误处理机制,能够自动将Windows API错误码转换为异常或状态码,提升代码健壮性。此外,库中还包含容器类(如wil::vector)、字符串处理工具、日志系统和安全接口(如wil::shared_ptr)等模块,帮助开发者简化Windows API调用复杂度,减少内存泄漏、资源未释放等常见问题。其工作原理依赖于模板元编程和内联函数,通过头文件直接展开代码,避免了传统库的链接依赖问题。WIL的设计注重与Windows系统API的深度集成(如Windows SDK),同时部分模块(如跨平台容器)支持其他操作系统。作为微软内部工具链的一部分,WIL经过大规模生产环境验证,适用于Windows桌面应用、驱动开发、系统工具等场景,目标是为开发者提供更简洁、安全且符合现代C++标准的Windows开发体验。 -
arximboldi/immer arximboldi/immer 是一个为C++语言设计的现代不可变数据结构库,专注于提供高效且持久化的数据结构实现,其核心目标是通过值语义(value semantics)的特性,在大规模数据处理场景中实现性能与安全性的平衡。该项目的核心特色在于其不可变(immutable)与持久化(persistent)数据结构的设计,所有数据操作均不会修改原始数据,而是生成新的数据版本,从而保证数据在并发或函数式编程中的线程安全性和逻辑一致性。其工作原理基于结构共享(structural sharing)技术,通过只复制数据结构中实际发生变化的部分,而非整体复制,显著降低了内存消耗和操作开销。例如,在修改列表或映射时,immer会保留未变更的节点结构,仅复制变更路径上的节点,从而实现接近常数时间复杂度的高效操作。这种设计特别适用于需要频繁创建数据副本但希望保持低内存占用的场景,如函数式编程、状态管理框架或分布式系统中。此外,immer支持多种基础数据结构,包括列表、映射、集合等,并提供了与C++标准库兼容的接口,便于集成到现有项目中。项目还强调对现代C++特性的支持,如移动语义和RAII机制,确保代码的高效与安全性。通过将不可变性与持久化特性结合,immer为开发者提供了在大规模数据处理中兼顾性能与逻辑正确性的解决方案,尤其适合需要高并发或不可变数据保障的复杂系统开发。
-
stephenberry/glaze Glaze 是一个专为现代 C++ 设计的高性能数据处理库,支持 JSON、BEVE、CBOR、CSV、MessagePack、TOML 和 EETF 等多种数据格式的快速序列化与反序列化操作。该项目的核心优势在于其极高的运行效率,通过完全在内存中操作数据,避免了传统序列化库常见的磁盘 I/O 开销,同时利用模板元编程和类型安全机制实现了零配置的反射功能。Glaze 的工作原理基于现代 C++ 的模板特化和编译期元编程技术,通过头文件包含的方式实现零依赖部署,无需额外链接动态库或静态库。其反射系统能够自动识别结构体成员变量并生成对应的序列化代码,开发者仅需通过简单的宏注解即可实现复杂数据结构的序列化/反序列化,大幅简化了传统手动实现的繁琐流程。项目特别优化了性能瓶颈,例如通过避免冗余的内存拷贝和使用高效的编解码算法,使得处理速度达到传统库的数倍。Glaze 还提供了高度可定制的配置选项,允许开发者根据具体需求调整序列化行为,同时保持代码的简洁性和可读性。该项目适用于需要高频处理结构化数据的场景,如网络通信、数据存储、API 接口开发等,尤其适合对性能有严格要求的现代 C++ 项目。
-
ben-strasser/fast-cpp-csv-parser fast-cpp-csv-parser 是一个高性能的 C++ CSV 文件解析库,专为需要快速处理大型数据文件的场景设计。该项目采用流式处理方式,通过逐行读取和解析 CSV 数据,避免将整个文件加载到内存中,显著降低内存占用并提升处理效率。其核心优势在于解析速度,通过优化算法和避免不必要的数据复制,相比传统方法速度提升可达 10 倍以上,特别适合处理数百万行级的超大规模数据集。 项目支持多种 CSV 特性,包括处理带引号的字段、跳过空行、指定分隔符(默认为逗号),并能灵活解析表头行或直接读取数据行。其工作原理基于字符流逐字节分析,通过状态机识别字段边界,避免了传统方法中频繁的字符串拼接操作。库的代码结构简洁,依赖项极少,无需第三方库即可编译运行,并兼容 Windows、Linux 和 macOS 等主流操作系统。 开发者可通过简单接口实现快速集成,支持直接读取文件路径或已打开的文件流,解析结果以迭代器形式返回,便于与 STL 容器结合使用。项目提供详尽的测试用例验证功能稳定性,并包含性能对比基准测试,实测显示其在 1GB CSV 文件处理中耗时仅为其他主流库的 1/5。对于需要高吞吐量的数据处理场景(如金融交易日志分析、物联网数据解析),该项目提供了轻量级且高效的解决方案。
-
marzer/tomlplusplus marzer/tomlplusplus 是一个专为 C++17 设计的轻量级头文件 TOML 配置文件解析器和序列化工具,无需额外编译步骤即可直接集成到项目中。它支持 TOML(Tom's Obvious, Minimal Language)格式,这是一种以简洁语法和清晰结构著称的配置文件格式,广泛用于应用程序、游戏引擎和工具的配置管理。项目的核心功能包括解析 TOML 文件内容并将其映射到 C++ 对象,以及将 C++ 数据结构序列化为 TOML 格式,支持基本数据类型(如字符串、整数、布尔值)和嵌套结构(如数组、表)。由于其“头文件仅需”特性,用户只需包含头文件即可使用,无需链接动态库或静态库,极大简化了依赖管理和部署流程。该库的设计注重易用性和高效性,提供直观的 API 接口,允许开发者快速读取配置文件或生成 TOML 输出。同时,它兼容 C++17 标准,确保在现代 C++ 项目中的稳定性与可移植性。此外,项目可能包含错误处理机制,例如对无效 TOML 语法的检测,以增强健壮性。适用于需要灵活配置管理的场景,如游戏开发、工具链配置或跨平台应用。其开源特性允许社区贡献和持续改进,确保功能的扩展性和维护性。
-
vimpunk/mio vimpunk/mio 是一个基于 C++11 标准开发的跨平台头文件库,专注于提供高效的内存映射文件 I/O 功能。该项目的核心目标是通过将文件内容直接映射到内存地址空间,实现对大文件的快速读写操作,避免传统逐行读取或缓冲区拷贝的性能损耗。其工作原理基于操作系统提供的内存映射文件机制,通过将文件数据直接加载到内存中,允许程序像访问内存数组一样直接读取或修改文件内容,从而大幅减少系统调用和数据拷贝的开销。库的设计强调简洁性与实用性,提供随机访问、分块读取和文件锁等基础功能,适用于需要高频次文件操作的场景,例如日志分析、大数据处理或实时数据流处理。由于采用头文件实现方式,用户无需额外编译即可直接集成到项目中,同时支持跨平台兼容(Windows、Linux、macOS 等)。相较于传统 I/O 方式,mio 的内存映射机制在处理超大文件时能显著降低内存占用和 CPU 资源消耗,但需注意其对文件内容的修改需要配合操作系统的内存同步机制以保证数据一致性。该项目适合需要高性能文件访问能力的 C++ 开发者,尤其适用于对实时性和吞吐量有较高要求的场景。
Flutter程序
- fluttergems/awesome-open-source-flutter-apps 该项目是一个精心整理的开源 Flutter 应用程序列表,旨在为开发者提供高质量、功能丰富且可学习的 Flutter 开源项目资源。项目特色在于通过分类和详细描述,帮助用户快速找到适合的学习或使用场景,例如涵盖 UI/UX 设计、动画效果、生产力工具、游戏开发等类别。每个项目均附有简介、核心功能、使用的技术栈(如 Firebase、Flutter 插件等)及项目链接,便于开发者深入了解或直接参与贡献。工作原理上,该项目通过 GitHub 社区协作维护,开发者可通过提交 Pull Request 推荐优质项目或更新现有条目,确保列表的时效性和多样性。此外,项目强调开源精神,鼓励用户学习代码、改进功能或将其作为参考模板用于自身开发。部分项目还提供详细的文档和教程,适合不同水平的开发者学习 Flutter 实践技巧。该列表不仅帮助开发者发现灵感,还促进了 Flutter 生态中的技术交流与协作,成为学习和提升 Flutter 开发能力的重要资源。由于其结构清晰、内容实用,该项目已成为 Flutter 社区中广泛参考的开源项目索引工具。
Go程序设计
Java程序设计
Python程序
-
originalankur/maptoposter MapToPoster 是一款基于 Python 的实用工具,可让您使用代码将喜爱的城市地图转换为简洁醒目的海报。该项目的核心目标是极简设计:它去除多余的地图元素,同时保留道路、河流、公园和重要地标等关键地理要素。用户只需提供城市名称(或自定义数据),然后调用 MapToPoster 即可生成可用于打印或数字分享的高分辨率图像。该工具会自动选择合适的投影方式,应用强调精致优雅的默认调色板,并根据用户的偏好生成 PNG、JPEG、PDF 或 SVG 等常用格式的静态图像。您可以在导出前调整线条宽度、颜色强度、标签位置、背景颜色等参数,甚至添加您自己的品牌徽标或标语,从而使每张海报都真正独一无二。MapToPoster 的工作原理是解析来自 OpenStreetMap 或 GeoJSON 文件等来源的矢量数据,然后使用 geopandas、matplotlib 和 shapely 等库进行渲染,以进行精确的几何计算。生成的代码简洁明了:只需调用一个函数,传入城市名称(或路径)和输出文件名,并可选择是否接受样式覆盖。为了方便用户复现,MapToPoster 会将所有配置存储在 JSON 或 YAML 配置文件中,以便与合作者或跨项目共享精确的样式。它还支持批量处理,无需手动设计即可自动创建数十张用于活动、作品集或课堂讲义的海报。由于 MapToPoster 采用 MIT 许可证开源,您可以自由地 fork、修改并将其集成到更大的应用程序中,例如城市规划仪表盘、旅游指南或以简洁、引人入胜的方式展示城市地理的教育工具。总而言之,MapToPoster 通过提供便捷的导出流程、极简的默认样式以及灵活的自定义功能,将代码转化为精美的地图海报,满足任何用户的创意需求。
-
open-spaced-repetition/fsrs4anki fsrs4anki是一个基于现代算法Free Spaced Repetition Scheduler(FSRS)开发的Anki自定义复习排期工具,旨在通过科学算法优化记忆效率。该算法源自Anki开发者原生的FSRS算法,并经过优化改进,能根据用户的记忆曲线动态调整复习间隔和重复次数,相比传统Anki默认的间隔算法,可减少约30%的重复次数,同时提升长期记忆效果。项目支持Windows、macOS和Linux平台,提供用户友好的图形界面,允许用户通过配置文件自定义算法参数,如遗忘曲线系数、记忆强度阈值等。其核心原理是通过数学模型计算用户的记忆强度,结合艾宾浩斯记忆曲线理论,自动判断最佳复习时间点,并生成个性化复习计划。项目提供自动备份功能,确保用户数据安全,同时拥有活跃的社区支持和持续更新的维护。安装方式包括通过GitHub克隆源码或下载预编译安装包,需依赖Python 3.8+环境和部分第三方库。相比原生Anki排期系统,fsrs4anki的算法能更精准地预测用户的遗忘时间点,尤其适合需要高频复习的用户群体。目前项目已集成到Anki的插件生态中,用户可通过插件商店直接安装使用。
-
RICHQAQ/PasteMD PasteMD是一款专为提升办公效率开发的跨平台工具,可一键将Markdown文本和AI对话(如ChatGPT、DeepSeek等)内容快速粘贴到Word、WPS和Excel等办公软件中。该项目基于Python开发,采用GUI图形界面设计,支持Windows、MacOS和Linux三大主流操作系统,用户无需复杂配置即可使用。其核心功能在于智能解析Markdown格式内容,自动适配Office软件的排版规范,同时支持AI对话内容的结构化转换,例如将多轮对话内容按时间轴或层级关系进行格式化排列,确保粘贴后的内容在文档中保持清晰可读性。技术实现上,项目通过解析器将Markdown语法转换为Office可识别的格式,并利用Office的COM接口或API实现内容注入,支持自定义样式模板和内容过滤规则。此外,工具还提供命令行模式满足自动化需求,用户可通过参数配置输出格式和目标文档路径。项目开源且持续更新,适用于需要频繁处理AI生成内容、Markdown文档或跨平台办公的用户群体,尤其适合研究人员、学生及职场人士提升文档编辑效率。其最大亮点在于打破不同文档格式间的兼容壁垒,使AI生成的复杂内容能快速转化为专业办公文档,显著减少手动排版时间。
-
elapouya/python-docx-template python‑docx‑template 是一个把普通 Word 文档(
.docx)当作模板文件,并用 Jinja2 语法来填充占位符的 Python 库。它的核心类是DocumentTemplate,在构造时传入要做成模板的.docx路径;随后你可以通过调用render(data)或者render_from_dict(dict)把文档里出现的所有{ { 变量 } }替换为你提供的数据。这里的占位符与 Jinja2 标准语法保持一致,你既能写简单的 “{{ title }}”,也可以在表格或段落中使用循环、条件判断,甚至把图片放进来(支持{{ image1 }}等)。库内部是先用 python‑docx 读入 Word 文档,再利用 Jinja2 的解析器把所有文本块转成模板节点,然后在渲替换阶段遍历这些节点,把占位符的值填充进去,最终再把变更后的文档写回磁盘。ContentFile(path="README.rst")则是一个辅助工具,用来读取项目自带的 RST 格式 README 文件,并将其内容作为模板正文的一部分;这让python‑docx‑template既能做自己的示例,也能直接把 RST 文档渲替换成 Word。整个工作流程非常直观:先准备好数据(推荐用Data(title="…", items=[1,2])或普通字典),再装载.docx模板文件,最后调用render()并保存为新文档;你也可以在 Jinja 环境里定义自定过滤器或全局环境。项目附带有完整的安装说明(pip install python‑docx‑template)以及一套示例脚本和单元测试,用来验证占位符填充、循环表格等功能是否正常。总之,python‑docx‑template 让你可以用熟悉且强大的 Jinja2 模板语法,把 Word 文档做成可重用的动态模板,而不必再手动操作底层 XML 或 Office 对象,从而大幅提升文档生成效率与代码可读性。 -
seperman/deepdiff DeepDiff是一个用于深度比较和分析Python对象/数据的工具库,其核心功能包含三个模块:DeepDiff、DeepHash和Delta。DeepDiff能够递归地比较任意Python对象(如字典、列表、类实例等)的差异,支持检测值变化、新增/删除项、类型差异等,并生成结构化的差异报告。DeepHash则基于对象内容生成哈希值,实现对数据内容的唯一标识,可用于版本控制或数据一致性校验。Delta模块通过计算对象间的增量差异(deltas),支持通过逐步叠加增量数据重建目标对象,适用于版本追踪或数据变更分析场景。该项目采用递归算法解析对象结构,结合类型检查和内容比对,能够处理嵌套数据、自定义对象和复杂数据类型。其特色包括:支持多种数据类型(如字典、列表、集合、对象等)的深度比较,生成差异报告时可精确到字段层级;DeepHash的哈希算法基于对象内容而非引用地址,确保数据一致性;Delta模块通过增量计算实现高效的数据重建。该工具适用于调试、测试、数据验证和版本控制等场景,可帮助开发者快速定位数据差异并进行修复。其开源特性允许用户根据需求扩展功能,同时文档提供了详细的使用示例和API说明。
Rust程序设计
-
pamburus/hl hl 是一个快速且功能强大的日志查看器和处理器,其核心功能是将 JSON 格式或 logfmt 格式的日志文件转换为清晰的人类可读格式,帮助开发人员和系统管理员更高效地分析日志数据。该项目采用高效的数据处理算法,能够实时解析复杂日志结构并以结构化方式展示关键信息,支持对日志内容进行过滤、搜索和字段筛选等操作,显著提升日志分析效率。hl 的工作原理基于对日志文件的流式解析技术,通过识别 JSON 对象或 logfmt 的键值对格式,将原始日志数据转换为带有颜色标记和层级结构的可视化界面,用户可通过命令行或图形化界面查看处理后的日志内容。项目特别优化了性能,可处理超大规模日志文件而不会导致内存溢出,并支持通过配置文件自定义日志解析规则和展示格式。hl 的安装方式灵活,可通过包管理器或从源码编译安装,兼容 Linux、macOS 和 Windows 等主流操作系统,同时提供丰富的命令行参数和插件接口,允许用户根据需求扩展功能。该项目适合用于开发调试、服务器监控或日志审计等场景,尤其适用于需要快速定位错误信息或追踪系统行为的场景。开发者文档和示例代码已集成在项目仓库中,用户可通过 GitHub 获取源码并参考 README 文件进行部署和配置。
-
Diorser/LiteMonitor LiteMonitor是一款轻量且高度可定制的开源桌面硬件监控工具,旨在为用户提供实时、精准的系统性能监测服务。它能够通过访问系统底层接口实时收集CPU、GPU、内存、磁盘和网络等核心硬件的运行数据,确保监测结果的准确性和时效性。软件界面简洁现代,支持横竖屏模式切换,适配多种显示需求,同时提供多语言支持、主题自定义、透明度调节等个性化配置选项,满足不同用户的审美与使用习惯。其特色功能包括三色报警系统(绿色、黄色、红色)直观显示异常状态,配合透明度显示功能可更清晰地观察系统状态变化。用户可通过高度可配置的界面调整监控参数、报警阈值及显示样式,实现个性化监控方案。该项目基于开源协议开发,注重轻量化设计,避免资源占用过高,适合对系统性能有实时监控需求的用户群体,无论是日常使用还是深度调试,都能提供稳定高效的监测支持。
-
zealotCE/America-Against-America
America-Against-America是一个基于 Python 的 OCR 处理工具,专门为王沪宁先生上世纪80年代末在美国所撰写的《美国反对美国》一书而设。该文本原始以扫描 PDF 文件形式保存,由于当时技术与硬件条件限制,PDF 内仅包含低质量的位图(bitmap)——无任何可直接编辑的文字层。因此,本项目旨在将这份历史珍贵文档转换为现代化、机器可读的纯文本格式,以便后续检索、归档及学术引用。 核心功能与特色 1. 多模 OCR 识别 – 项目默认调用 Tesseract-OCR(v4+)作为主要文字辨认器,并支持使用 PaddleOCR 或 EasyOCR 等第三方引擎进行二次校验,以提升识别准确率。 2. 手工纠错与标注 – 由于扫描文档常见的字体变形、印刷痕迹,工具会将 OCR 结果导出为 JSON/CSV 文件,并提供命令行接口,让使用者以「人眼」方式快速检查并标注错误(如“美国”误识成 “美洲”等),随后自动纠正。 3. 批量化处理 – 项目支持一次性读取同目录下所有 PDF,采用多线程/多进程(concurrent.futures)实现高效能的文件并行转换;每个文件会生成对应的.txt、.json文件,以供后续版本控制或文档管理。 4. 可扩展结构化输出 – 识别完成后,工具将文本按章节(如“序言”“第一章”)拆分,并给出一个包含title, content, page_no的列表;若需进一步做 NLP 或语义分析,可直接接入spaCy、nltk等库。 5. 简易安装与使用 – 项目只需要pip install -r requirements.txt,并在命令行执行:bash python main.py --input-dir ./pdfs/ --output-dir ./txt/其中可通过--lang zh-CN指定语言;若想一次性开启多种识别器,可使用--engines tesseract easyocr paddlepaddle等选项。 工作原理 - PDF → Image:首先利用pdf2image(基于poppler)把每页 PDF 生成高分辨率的 PNG; - OCR 辨认:对每张图像,调用指定 OCR 引擎获取文字层,同时返回置信度得分。若使用多引擎,可将同一文本段落在不同引擎结果做投票(majority vote)以决定最终字串; - 后处理与纠错:OCR 产生的字符串会被拆成行/词,依据pytesseract的box数据生成可视化标注文件;随后将 JSON 推送至jq或直接在代码中循环,对常见误识(如“Americas”)进行正则替换。 - 结构化输出:结合文本与页码信息,构造一个包含章节标题、正文及页码的树状结构,并序列到.json/.txt之中;若后续需要做检索,可直接用grep -i "美国"在.txt上搜索。 贡献者指南 - 拉取请求(Pull Request):请在主干分支上提交,遵循项目的代码风格并通过单元测试 (pytest) ; - 错误报告:若发现 OCR 误差或结构化问题,请打开 Issue 并贴出对应页码、原始图像与纠正结果。 结语 该工具将王沪宁先生80年代末赴美写作的《美国反对美国》从低质量扫描 PDF 中完整恢复,既保留了历史文本,又为后续学术研究提供可编辑、检索友好的数据。项目以 Python 简洁实现,配合 Tesseract 等成熟 OCR 技术,可在任何支持 Docker 的环境下直接部署;若想进一步扩展到多语言或更高级的语义分析,只需添加对应 NLP 模块即可。本工具不仅是对历史文档的一次技术性修复,也是面向未来跨学科研究的桥梁。
游戏
- SteamDeckHomebrew/decky-loader decky‑loader 是一款专门为 Steam Deck 开发的插件加载器,旨在让用户能够轻松地把自定义的共享库(
.so)插入到游戏进程中,而不需要改动原始二进或拥有系统管理员权限。它通过一个简单但实用的工作机制来实现这一目标。 首先,它利用了 Steam Deck 现有的沙箱与文件访问约束:所有可执行文件默认只能够读取自身目录下的资源,无法随意去读外部路径。而decky‑loader则在启动时会检查一个名为 DECKY_FILE 的环境变量;如果这个变量被设定,它就把其值当作插件文件(或多文件用冒号分隔)来加载。只要将该程序放置于游戏可执行路径下,并且以LD_PRELOAD之类的方式去启动目标进程,Steam Deck 就会通过此环境变量把指定的库注入到正在运行的游戏里。 在技术层面,它是用 C 编写、基于 Linux 的动态链接器(glibc)实现。加载时它先调用dlopen去打开插件文件,然后再使用dlsym找出插件中约定的入口函数(如init()),并立即执行此函数,以完成初始化工作。整个流程保持在最小化:仅一次性检查环境变量、一次性载入库、一次性调用入口,随后便把控制权交还给原始游戏程序,让它继续按常规运行。 除了上述核心功能,它也提供了几项实用的扩展特性。用户可以通过LD_LIBRARY_PATH或者在插件中使用自定义符号来让更多动态库被顺利载入;若需要一次载入多个共享库,DECKY_FILE里的值就能以冒号分隔多条路径,程序会按顺序依次去加载。除此之外,它还把一些简易的 API 暴露给插件开发者,例如decky_print()用来在 Steam Deck 的终端打印日志;以及允许在插件中通过宏方式声明全局部件(DECKY_EXPORT)等,以便让编写者更快地完成与系统交互。 从使用体验上看,decky‑loader既不需要修改游戏原始代码,也不会导致 Steam Deck 的文件权限被破坏。用户只需在想要插件化的游戏里,将其启动选项(Steam Desktop 模式下可通过游戏属性设定)改为DECKY_FILE=/path/to/plugin.so ./game,或者直接把 loader 作为一个包装脚本来执行。这样就能让任何基于 Linux 的 Steam Deck 游戏在无需 root 权限的前提下,得到插件化的功能。 目前它已被积极地接受社区贡献;项目主页提供了完整的编译说明、示例代码与 API 文档,并且使用 MIT 许可证发布,欢迎开发者按照官方流程提交补丁或扩展。总之,decky‑loader 用最简洁的方式,把插件加载进 Steam Deck 游戏的世界,让用户在自己的设备上享受更自由、更丰富的游戏体验。
知识管理_wiki知识库
- saber-notes/saber Saber(跨平台手写笔记应用) Saber 是一款 开源、跨平台 的手写笔记工具,专为在任何显示屏幕上绘画和记录而设计。无论你使用的是 Windows、macOS 还是 Linux,只要满足系统版本要求即可直接运行;若是 macOS,还可以通过 Homebrew 一键安装。 > 核心功能: > > - 手写输入:支持多点触控,能够感知笔压并在绘图时产生自然的线条效果。 > - 采用 现代化 UI(SwiftUI、Electron 等),界面简洁、响应迅速;同时提供“暗色模式”与自定义配色方案。 > - 支持 多文件管理,可按主题或日期快速定位记录,并能一键导出为 PDF / PNG/JSON 供备份使用。 > - 内置 即时预览:写完后立即在右侧实时显示最终效果;若想编辑,左侧即是原始绘图区。 > 技术实现概述 > > 1. 前端使用 React + Redux 管理 UI 状态,并通过 WebView 把 Canvas 渲染至浏览器。 > 2. 后端采用 Python Flask 或 Node‑JS**,负责文件读写与压缩存;所有数据最终以 JSON / SQLite 存储本地,以便离线使用。 > 3. 为兼容 Windows 与 Linux,还内置了 WSL(Windows Subsystem for Linux) 的运行脚本,使在 WSL 环境中也能直接启动。 > 安装与使用 > > - 在终端执行
git clone https://github.com/saber-notes/saber.git,随后进入项目目录后运行npm install && npm run dev(或对应的 pip 命令)。 > - 若想打包发行,可通过npm run build或python setup.py sdist bdist_wheel获取对应平台可执行文件。 > - 启动后,主界面左侧为“笔记列表”,右侧为绘图区;在笔记中写文字/画线即可直观其效果,并可以随时导出或分享。 > 适用场景 > > 1. 教学演示:老师可直接在投影上书写、标注并即时记录。 > 2. 思维绘图:学生可在平板上自由画图,随后通过 Saber 保存成档案。 > 3. 企业汇报:技术人员可以现场绘制流程图,便于后续的 PPT 或演示使用。 > 贡献与社区 > > 任何人都能直接 fork 本仓库,并提交 PR;Saber 团团已在 GitHub 上设立 Issue 与 Wiki,用以协助新手及 bug 修正。若你想加入开发,可先阅读 README 的“贡献指南”,随后即可通过git push将自己的改动同步至远程主分支。 > 总结 > > Saber 让写字与绘图不再受限于单一设备,而成为跨平台的手段;它简洁易用、性能稳定,同时保持完全开源,适合所有对“在任何屏幕上书写”有需求的人士。希望你也能从这份简单而强大的工具中获益,并为其发展添砖加瓦。
终端
-
adi1090x/polybar-themes adi1090x/polybar-themes 是为 Polybar(常用于 Linux 桌面环境的状态栏)提供大量主题的 GitHub 仓库,内容丰富、样式多变。它把上百个不同风格、颜色与变体的配置文件统统收进来,包括浅色版、深夜模式、以及兼容特定图标或字体的专用方案;每一套都能直接加载到用户自己的
~/.config/polybar/目录下。只需把对应.conf或.json文件拷贝进去,再按需要改名或在主配置里加上include = "themes/<id>"的一句,Polybar 在启动时就会自动识别并应用。 仓库的 README.md 极为简洁,却已说明“这是一个拥有不同风格、颜色与变体的大型 Polybar 主题集合”。其中有一行提示:ContentFile(path="README.md")——这表示读者可以直接查看此文件以获取完整使用细节。除此之外,文档里还给出了如何贡献的指引:Fork 本仓库 → 在本地新增或修改主题 → 提交 Pull Request,并在 PR 描述中写清楚改动内容,以便评审快速把握。 从技术原理来看,Polybar 通过解析~/.config/polybar/下的配置文件来决定栏块、文字样式及颜色。仓库里的每一套主题其实就是一个预先排好配置段落,只要“include”即可在任何 Polybar 设置里使用;如此既能大幅提升自定义状态栏的效率,也让初学者可直接复制粘贴得到专业级外观。 本项目采用 MIT 许可证,用户可以自由地使用、修改与分发。无论你想打造极简或炫彩渐变色调的 Polybar 状态栏,只要在此仓库中挑选对应主题,即能轻松获得所需风格与配色方案。 -
karol-broda/snitch Snitch 是一个轻量级、易用的命令行工具,专门用于在 Linux 系统上以视觉更佳、更直观的方式查看网络连接。它并不单纯粘合“netstat”或 “ss”,而是直接读取
/proc/net/tcp、/proc/net/unix等文件,将每条 socket 的信息(协议、本地地址与端口、对方地址、PID 与程序名等)解析后,按进程名称和网络协议进行分组并用表格形式打印出来。输出的列顺序大致为:Proto / Local Address / Peer Address / PID/Program。此外 Snitch 还会在每条 socket 下方再展开显示该进程所打开的文件描述(如fd0、fd1等),并且将这些信息用颜色高亮,帮助用户快速定位某个服务到底是哪个程序监听了指定端口。 核心特色: | 特点 | 说明 | |---|---| | 人性化输出 | 用表格 + 对齐、列宽自动适配,可直接复制粘到终端或文件中。| | 按进程分组 | 同一进程的 sockets 会在同一区块显示,方便查看某个服务所占用的全部端口与地址。 | | 协议/端口过滤 | 通过-p <pid>或者--proto tcp、-t 80等参数快速筛选目标。| | 跨进程信息 | 除了本地 socket 外,还会在表格里显示该 socket 所对应的进程树(如 systemd→nginx)以及打开文件描述,便于排查服务间的相互依赖关系。| 使用方式非常简洁:bash # 直接列出系统当前所有监听与已建立的 TCP/UDP 连接: snitch # 按指定进程筛选(例如 pid=1234): snitch -p 1234 # 列出只属于某个协议(如 tcp)的 socket: snitch --proto tcp # 或者直接通过端口过滤,例如列出所有监听 80 的连接: snitch -t 80如果你未安装 Go 环境,Snitch 也支持直接下载预编译的二进制文件:访问 GitHub Releases 页面(karol-broda/snitch)即可。若已安装 Go,则可通过:bash go install github.com/karol-broda/snitch@latest得到snitch可执行文件后,将其放入系统 PATH 里即可随时调用。 在实际使用中,Snitch 经常被运维工程师、DevOps 或者开发者用于: 1. 快速定位端口冲突:如某服务报 “Address already in use”,直接用snitch -p <pid>就能看到占用了该端口的其他进程。 2. 监控网络流量:结合-t过滤,可在同一台机器上同时运行多组 Snitch,观察不同服务对外部连接数目与来源。 3. 排查未预料的 socket 使用:某些程序会自动打开后台 socket(如 systemd 的 cgroup 控制),Snitch 可以把这些隐藏的信息以可读形式列出,让运维者一眼便能判断是否有多余或潜在安全风险。 总之,Snitch 通过简洁的人性化表格、按进程分组以及支持协议/端口过滤等功能,将 Linux 下的网络连接信息呈现得既直观又方便操作,是任何需要快速查看当前监听状态与 socket 分布情况时的首选工具。
编辑器
计算机编程_数据结构与算法
- trekhleb/state-of-the-art-shitcode
trekhleb/state-of-the-art-shitcode是一份以轻松幽默方式讲解“写代码最糟糕做法”的 GitHub 项目。它把“state‑of‑the‑art”与 “shitcode” 结合,形成一种反向的、专门收集 anti‑pattern 的框架:项目目标是让读者清晰知道哪些代码会导致可维护性低、执行效率差或容易出错,并通过示例帮助大家一眼识别并避免落入这些坑。 README 在正文里先以大标题“State of the Art Shitcode”标注,随后用一句诙谐的说明介绍项目意义,再列举若干核心原则与典型做法。 核心原则(示例摘录) 1. 魔术数字随处写:直接在代码里使用 0、1、100 等整数,而不是给常量命名。 2. 全局状态一箩包:把所有全局变量聚集到同一个 module 或文件中,避免分散。 3. 注释只留必要时:如果不需要解释,代码直接写;若需说明则在必要位置加简短语。 4. 深度嵌套:用多层 if、for 噶或递归来实现本可通过简单逻辑完成的功能,以增加阅读难度。 5. 对全局态过度依赖:业务大部分直接读取全局变量,而不是传参或使用闭包隔离。 示例(Python)python # 纯粘土的实现 global_state = {} def init(): global_state['x'] = 42 # 直接写全局状态该段代码直接把业务数据放进global_state,缺少注释且难以追踪。类似地,在 JavaScript、Ruby、Java 等语言中也给出了对应的反模式示例:例如在 JS 中用全局对象存储所有配置;或在 Ruby 中使用全局变量并忽略单元化。 项目特色 - 采用轻松诙谐的 README,帮助初学者快速识别“shitcode”与好代码。 - 用“State‑of‑the‑Art”这一标题讽刺对 “最先进” 的传统追求,让读者在玩笑中记住反向标准。 - 通过多语言示例(Python、JavaScript、C++ 等)让人们能快速比对照各自语言的反模式,提升跨语言的代码审视感知。 工作原理 项目文件结构按语言分层:python/,javascript/,cpp/等,每个子目录下放置对应示例文件(如snippet.py、example.js)。README 用 Markdown 列表格展示每个反模式的核心概念,并在代码块旁边用简短注释说明为何是糟糕做法。 贡献流程 读者若想加入新的“shitcode”示例,只需提交 PR 并按项目命名规则(如python/下新文件),并遵循 README 中列出的核心原则即可。项目管理员会快速审查并合并。 --- > 综上,State‑of‑the‑Art Shitcode 项目是一份幽默但具教育意义的反向代码收集。它通过“魔术数字、全局态依赖、深度嵌套”等核心原则,配合多语言示例,让人们能快速识别并避免糟糕做法,从而提升日常编码质量。
因果推断
图数据库图算法
图神经网络GNN
其他_图神经网络GNN
图卷积网络
图对抗攻击
图嵌入_网络表征学习
图机器学习库
图注意力机制
图监督_半监督_对比学习
图聚合_节点聚合
图预训练_Pre-TrainingOfGraph
异构图_异质图
时空网络_交通预测_动态图
- limix-ldm/LimiX LimiX是一个基于结构化数据建模能力的通用智能系统项目,旨在通过创新性的多模态数据处理技术提升人工智能模型的通用性与跨任务适应能力。该项目通过构建模块化架构实现对文本、图像、音频等多模态数据的高效处理,其核心工作原理基于结构化数据建模技术,通过建立数据间的显式关系网络实现跨模态信息的对齐与融合。该系统采用分层式设计框架,包含数据预处理、特征提取、关系建模和任务适配四个核心模块,其中创新性地引入动态关系图网络(DRGN)技术,可自适应构建数据间的语义关联图谱。相较于传统模型,LimiX通过引入分层注意力机制实现对复杂数据结构的精准建模,同时结合跨任务迁移学习策略,使模型在保持高精度的同时具备良好的可扩展性。项目特别强调对非结构化数据的处理能力,通过多模态对齐模块实现文本、图像等异构数据的统一表征,其独特的模块化设计支持快速部署到不同应用场景。研究团队在arXiv论文中提出基于结构化数据建模的通用智能框架(https://arxiv.org/abs/2509.03505),该框架已在多个基准测试中验证其在跨模态理解、多任务推理等场景下的优越性能,为通用人工智能系统的发展提供了新的技术路径。
大数据
其他_大数据
向量数据库_向量搜索_最近邻搜索
数据库管理系统
-
clockworklabs/SpacetimeDB SpacetimeDB:重新定义实时数据处理的数据库 SpacetimeDB 是由 Clockwork Labs 开发的一款革命性的开源数据库,专为游戏和实时应用设计,其核心解决了传统数据库在低延迟、多玩家同步和复杂状态管理中的性能瓶颈。通过将数据库与计算引擎深度集成,它实现了开发者无需维护独立服务端即可构建实时交互应用的愿景,极大降低了分布式系统的开发复杂度。 该项目最突出的三大亮点在于:首先,内置的确定性逻辑引擎允许开发者用 Rust 或 Python 编写业务逻辑,代码直接在数据库内部执行,消除了传统架构中数据库与应用服务器间的网络延迟;其次,基于事件驱动的状态同步机制通过"订阅-推送"模式自动将数据变更广播给客户端,相比传统轮询或长连接方案,资源消耗降低超 90%;最后,去中心化的时间戳系统利用逻辑时钟而非全局时钟达成一致性,使得全球分布的游戏节点能保持毫秒级同步,这一设计甚至优于许多商业游戏引擎的解决方案。 其技术原理可通过一个类比理解:想象数据库是一个高速运转的"时空引擎",每当玩家操作触发事件(如移动角色),引擎会像物理定律一样立即确定该事件对所有关联客户端的影响,并通过"因果链"(类似区块链的哈希链接但无加密开销)确保所有节点按相同顺序处理事件。这种架构本质上将数据库转化为一个可预测状态的确定性状态机,而客户端如同观测者,始终接收到经过引擎计算后的合法状态快照。 SpacetimeDB 通过 Rust 实现的高性能存储层支持每秒数十万次事务,其模块化设计允许扩展存储后端(当前支持本地存储和内存模式)。与 Firebase 等实时数据库相比,它通过牺牲部分灵活性换取了游戏开发中最关键的确定性;相较传统 SQL/NoSQL 方案,它又将业务逻辑从应用层下沉到数据层,使开发者能像编写单机程序一样处理分布式状态。这种"数据库即服务端"的范式,可能成为下一代实时应用基础设施的重要拼图。
-
Maxteabag/sqlit Maxteabag/sqlit 是一款用 Python 编写的命令行交互工具(TUI,文本用户界面),专门为 SQL 数据库提供友好、易上手的操作体验。它利用 Python 标准库中的
curses或类似模块绘制纯文字窗口和表格,让你可以在终端里直接输入 SQL 语句并即时看到执行结果,完全不需要图形界面。 核心功能包括: - 多数据库兼容性:内置驱动支持 Microsoft SQL Server、MySQL、PostgreSQL、SQLite、Turso 等主流关系型数据库,还可通过自定义驱动扩展更多后端。 - 命令行参数解析:启动时可以传入-d 数据库名、--host 远程地址等选项,程序会自动建立对应的 DBAPI 接口并连接到目标数据库。 - 查询执行与结果渲染:将用户输入的 SQL 查询发送至服务器后,接收返回的数据集;随后使用 curses 将结果格式化为可滚动表格,并在终端中实时显示。 - 交互便利特性: - 上下键浏览长结果页、左右键缩放视图; - TAB 自动补全关键字和已知的表名/列名,提升输入效率; - 快捷键q退出、h显帮助信息,以及可保存历史命令以便后续使用。 整个程序几乎不含任何第三方 GUI 库,只是纯文本渲染与数据库交互。正因如此,它可以在 Linux / macOS / Windows (WSL) 等终端环境 下直接运行,也能通过 ssh 远程登陆主机,满足开发者和 DBA 在多种操作系统中使用 SQL 的需求。 总之,Maxteabag/sqlit 为需要用命令行快速查询、编辑与管理数据库的用户提供了一套完整且易学的交互工具,使他们在终端里即可像玩文字游戏一样轻松完成 SQL 工作。 -
maxpert/marmot maxpert/marmot 是一个基于 SQLite 的分布式数据库实现,核心目标是让任何依赖 MySQL 的应用可以无缝合并接入该系统。它通过在 TCP 层提供兼容 MySQL Wire 协议的接口来完成这一转化。客户端向服务器发起始字“COMCONNECT”“SET NAMES utf8”等常用语句后,marmot 解析这些命令,将其映射为 SQLite 对应的 SQL 语句并在本地执行;随后将结果通过 Wire 格式返回给客户端,从而几乎所有使用 MySQL 驱动的 ORM 或数据库工具都能正常工作。为了实现数据分布,服务器采用了多节点共存与一致性协议:每条写入操作会被复制到集群内其它节点,并在后台执行乐观锁定以保持事务隔离;读取时则可按权重或最近邻优先返回,从而几乎所有使用 MySQL 驱动的 ORM 或数据库工具都能正常工作。marmot 也内置了简单的 WAL(Write Ahead Log)与 checkpoint 机制,保证磁盘持久性并在节点失效后能快速恢复。使用上只需把 MySQL 的 host 改为本地端口号或通过 Docker 镜像,即可直接以“mysql -h127.0.0.1 -P3306”命令连入;其余的 API 与 SQL 方言基本保持与标准 MySQL 一致。
数据搜索引擎
安全与渗透
webshell_shellcode
其他_安全与渗透
-
alibaba/OpenSandbox 一个专为AI智能体设计的沙箱运行时环境,它通过强隔离性解决了AI模型在不可信环境中执行时的安全风险,同时兼顾高性能与可扩展性。当前AI应用常面临模型被恶意输入攻击、依赖库冲突或资源滥用等问题,而传统容器方案存在性能损耗大、扩展性差等局限,OpenSandbox正是为填补这一技术空白而生。该项目的核心亮点首先体现在其多层次安全防护体系:通过内核级隔离(如eBPF技术)与用户态限制(如Seccomp)的深度结合,既能阻断恶意代码对宿主机的渗透,又能精细控制文件系统、网络等权限,安全性远超单纯依赖虚拟机的方案。其次,其轻量化设计带来近乎原生性能,相比传统Docker容器减少80%的启动延迟,使得AI推理、数据处理等高频操作不再受沙箱拖累。更独特的是模块化架构,开发者可通过插件动态扩展沙箱功能(如自定义监控指标或硬件加速支持),这种灵活性让它在快速演进的AI生态中始终保持适配能力。从技术原理看,OpenSandbox的运作逻辑类似于"智能保险箱":当AI模型需要执行任务时,系统会将其放入一个预配置的隔离舱(类似保险箱的独立隔层),所有对外交互必须通过严格安检(系统调用过滤)。关键创新在于其动态资源编排引擎——如同交通管制系统,能实时调节CPU/内存的"车道分配",既防止某个AI任务拥堵整体资源,又能在突发流量时自动扩容。底层依赖的Rust与Wasm技术栈则像"防弹材料",既保障了内存安全(避免缓冲区溢出等漏洞),又通过Wasm的跨平台特性实现"一次封装,随处运行"。这种设计使得OpenSandbox在金融风控、多租户AI平台等场景中展现出独特优势,成为平衡安全与效能的标杆方案。
-
jekil/awesome-hacking jekil/awesome-hacking 是一个收集各种黑客工具的仓库,旨在帮助安全研究者与渗透测试人员快速找到所需的工具。它把信息搜集、漏洞利用、密码破解、网络嗅探、逆向工程等功能按类别整理,让使用者能一目了然地看到每类工具的位置,并可直接从列表里点进去官方文档或 GitHub 页面进行下载与安装。仓库通过社区提交和审核来保证列表准确及时,项目里每个条目都标注许可与合法使用的注意事项,以便用户在测试前先确认自己的合规性。除此之外,它还提供示例脚本与演练,让初学者可以把这些工具集成自动化框架并进行实际渗透环境搭建,进一步学习如何利用漏洞或破解密码以评估网络安全。通过这种方式,jekil/awesome-hacking 成为技术人员快速获得、学习和实践黑客技能的高效资源集合。
-
WithSecureLabs/chainsaw chainsaw是一个由WithSecureLabs开发、以Python为核心的开源工具,专门用于快速搜索Windows取证文件。它把系统中所有可读的Artefacts——如事件日志(.evtx)、注册表键(.reg)、NTFS MFT记录、Prefetch、Shellbags等——映射到统一的数据模型,并在启动时利用并行扫描与多线程来构建高效能索引。通过这种预先索引,用户可以使用简洁的查询语法,如
process where name contains 'chrome' and start > 2024-02-01或event id = 4624 and user like '*admin*'等,进行正则匹配和时间范围过滤。chainsaw支持进程名、IP地址、自定义字段以及多维度联表查询,让调查者能够在秒级别完成跨文件系统的搜索任务。工具提供命令行界面(CLI)与Python API,并可将结果输出为JSON或CSV,方便后续的数据分析和报告生成。它兼容Windows 10/11及Server版本,并能直接读取本地日志、磁盘镜像等,而不需要额外安装第三方驱动;此外支持批处理脚本,可在持续集成(CI)环境中自动化证据搜索。许可证采用MIT,社区活跃维护,文档包括快速入门教程和查询示例,让新手也能迅速上手。 -
google/timesketch Timesketch是Google推出的一款协同式取证时间线分析工具,旨在让多名调查员能并行地对来自不同来源(如系统日志、网络流量、Windows事件等)的海量数据进行快速聚合与解读。它把每条记录抽象成“Event”,按时间戳归档,然后通过一种叫做“Timeline Graph”的图结构,把同一时间窗口内发生的事件连结成因果链,利用此图可直观看到关键活动节点及其前后关系。Timesketch支持Web UI与API两种交互方式,可在浏览器中绘制时间轴、添加标签、搜索关键词,并把注释同步给团队成员;也能将结果导出为JSON或CSV格式供进一步分析。该工具实现了自动化的事件过滤与分组,结合机器学习可标记异常模式,为取证工作提供高效、协同且易懂的视觉展示。
-
Yamato-Security/hayabusa Hayabusa(隼)是一款基于 Sigma 的威胁狩猎与快速取证时间线生成器,专为 Windows 事件日志而设计。它把 Sigma 规则解析成 PowerShell 或者原生的 Windows 查询语句,随后直接从本机或远程机器读取 .evtx 日志文件(亦可通过 SMB/WMIC 获得),过滤、聚合匹配条目,再按时间戳做连结并输出为 CSV、JSON、HTML 等易读格式。主要特色包括:1)自动识别多种攻击模式的 Sigma 规则;2)支持直接读取本地或远程 Windows 日志,且可一次性完成查询与过滤;3)提供预置好的示例脚本和规则集,方便快速上手;4)输出结果兼具图表化、文本及报表功能。其工作原理是:先将 Sigma 规则中字段映射至对应的 Windows 事件 ID、Source、TaskCategory 等属性,然后生成 PowerShell 查询语句执行,以此获取所有匹配日志,随后按时间戳聚合形成完整的攻击时间线。使用方式通常为:在 Python 环境下 pip install -r requirements.txt;运行 hayabusa.py 并指定目标机器与日期区间即可完成任务。该工具特别适用于安全团队快速定位潜在攻击痕迹、复现和报告,从而大幅提升事件日志取证效率与威胁狩猎精度。
加密_密码破解_字典
安卓Android
扫描器_资产收集_子域名
-
stamparm/maltrail MalTrail是一个基于 Python 的恶意网络流量检测系统,能够从 NetFlow、Zeek 日志等多种数据源中实时收集 IP 地址、端口号、协议以及包大小等特征,并通过统计熵值与阈值来识别异常。它将已知威胁数据库(如 Abuse.ch、VirusTotal)整合进分析流程,对流量进行分类和关联,支持多源数据的交叉验证,以提高准确率;一旦发现任何主机或服务在阈值之外,就会立即触发警报并生成 JSON 日志供 SIEM 或 Kibana 等可视化工具使用。系统提供简洁的 Web 界面,可实时查看异常、历史趋势和威胁分类,并支持插件扩展进其他情报源,帮助运维人员快速定位恶意行为并做出相应措施。
-
A-poc/BlueTeam-Tools A-poc/BlueTeam-Tools 是一个面向蓝队(防御团队)的开源项目,旨在为企业和组织提供一整套可操作的安全工具与技术。它把“日志收集、事件分析、威胁检测”以及“应急响应”等核心能力做成了可复用的模块,并以清晰的文档说明如何部署与使用。 项目特色 1. 多层监控 – 通过系统日志(如 Windows Event Log, Syslog)、网络流量捕获、文件完整性校验等手段,全面收集安全相关事件。 2. 可视化分析 – 所有工具都能把原始数据转成易读的图表或报表,让运维人员迅速定位问题点。 3. 脚本驱动响应 – 提供了基于 PowerShell、Python 的自动应急脚本,支持快速封堵恶意进程、隔离受感染主机等。 4. 模块化设计 – 每个功能都被拆成单独立的插件(如“IDS 检测”或 “事件追踪器”),可按需启用或自定义扩展。 工作原理 - 所有工具首先通过系统 API 或第三方库(例如 psutil、scapy)抓取所需数据。 - 数据被统一写入本地数据库(SQLite/ElasticSearch 等)并即时推送至监控面板。 - 通过预设的阈值或机器学习模型,脚本会在检测到异常后立即触发对应的处置动作,如关闭端口、清除恶意进程、生成安全事件报告。 安装与使用 项目提供了 Docker Compose 文件,可一键启动所有服务;也支持直接 clone 后执行
install.sh脚件自动配置。 每个模块都有独立的 README,详细列出命令行参数和示例用法。比如“File Integrity Monitor”只需跑:python fim.py --config config.yaml即可开始监控目标目录。 贡献与维护 欢迎提交 PR 或 Issue;项目采用 MIT 许可证,任何人都可以自由使用、修改或再发布。若有新威胁想要加入工具链,只需要在contrib文件夹下创建相应脚本并更新文档即可。 总体而言,A-poc/BlueTeam-Tools 把安全运维的“日志收集+事件分析+威胁检测+急响应”这一流程拆成一套可复制、易扩展的工具包,为企业提供了从被动监控到主动防御的一条龙门。 -
apurvsinghgautam/robin "robin"是一款基于AI的暗网开放源情报(OSINT)工具,旨在通过自动化技术从暗网中抓取、分析和可视化威胁情报数据。该项目采用Python语言开发,核心模块包含基于Scrapy框架的爬虫系统、LangChain集成的AI分析组件以及SQLite数据库存储模块,能够从暗网论坛、市场平台和泄露数据源中提取敏感信息。其工作原理是通过预设的爬虫规则访问暗网站点,使用AI模型对抓取的文本内容进行语义分析和实体识别,最终生成可视化报告和威胁情报摘要。 项目特色包括支持Tor网络匿名访问、可定制的爬虫规则配置、多线程加速抓取功能以及AI驱动的关键词匹配系统。工具可检测暗网中的恶意软件分发、勒索软件谈判、数据泄露等威胁信息,并通过NLP技术提取IP地址、邮箱、加密货币地址等关键数据。用户可通过命令行界面启动工具,配置目标暗网站点后,系统会自动完成数据抓取、AI分析和结果存储。项目依赖Python 3.8+环境,需要安装Tor服务并配置代理。由于暗网访问的特殊性,实际使用需确保符合当地法律法规,且工具仅适用于合法安全研究场景。目前该项目在GitHub上持续更新,但未明确标注维护状态。
-
sleuthkit/sleuthkit Sleuth Kit®(TSK)是一套完整的数字取证框架,既提供 C/C++ 编写的核心库,也配备一系列命令行工具,可直接在磁盘映像或实机上检查卷和文件系统结构、数据与元信息。它支持常见格式 NTFS、FAT32、ext3/ext4 等,并能读取卷头、目录树、文件属性(大小、创建/修改时间、权限)、原始内容以及被删除后仍留在磁盘上的痕迹。核心库设计为模块化,可被第三方取证软件调用,也可单独运行;如“fls”列出所有条目,‘icat’以偏移方式输出文件数据,“ffind”在卷上按字节模式搜索;命令行工具能直接找到证据而无需先装载。TSK 通过对卷映像进行低层次解析,在不改动磁盘内容的前提下读取元数据,帮助调查者还原被删文件、检查时间戳以及追踪系统活动。该项目最初始于 MIT 研究组,由 Dave Kline 等人开发,并已在学术界与执法机关得到广泛采用;其开源特性使得 Windows、macOS 与 Linux 平台皆可使用,Python 接口亦方便脚本化自动化分析。总之,TSK 为数字取证提供一套功能强大、易用且可扩展的工具集,满足从单文件检索到完整卷级别析的多样需求。
杀毒免杀_逆向工程
- mandiant/flare-floss FLARE Obfuscated String Solver(FLOSS) FLARE Obfuscated String Solver(简称 FLOSS)是一个开源工具,专门用来自动识别并提取恶意软件中被混淆或加密的字符串。它通过对二进制文件进行字节级扫描、模式匹配以及简单的解码逻辑来恢复原始文本,从而帮助逆向工程师快速定位关键信息,如 URL、命令、证书等。该工具支持多种编码方式(如 Base64、RC4、AES 及自定义算法)并能处理多层嵌套。使用方法简单:先通过 pip 安装依赖,然后直接运行
fls <binary>或在 Python 脚本中调用其 API;输出可为 JSON 或纯文本,可与其他工具链(如 Capa、Yara 等配合以实现自动化分析。FLOSS 的核心工作原理是:先扫描二进制文件寻找符合字符串格式的字节序列,然后对每个候选进行解码尝试,若成功即输出结果;同时会记录解码过程及相关匹配规则,以便后续调优。
漏洞库_漏洞靶场
-
KeygraphHQ/shannon Shannon Lite 是一款面向 Web 应用与 API 的自主化白盒渗透测试工具,其核心价值在于通过自动化分析源代码、识别攻击路径并执行真实漏洞利用,帮助开发者在代码进入生产环境前主动暴露安全隐患,从而解决传统安全测试中依赖人工、响应滞后且覆盖不足的痛点。 该项目的核心特色可概括为三点:其一,全链路自动化区别于依赖手动配置的扫描工具,Shannon Lite 从代码解析到漏洞验证全程自主决策,显著降低安全门槛;其二,白盒深度关联通过直接分析源码上下文,能识别诸如业务逻辑漏洞等传统黑盒工具难以察觉的风险,例如绕过身份验证的隐蔽路径;其三,攻击模拟真实性并非仅生成理论风险报告,而是通过模拟真实攻击链(如注入攻击或权限提升)提供可复现的漏洞证据,大幅提升修复优先级可信度。 从技术原理看,Shannon Lite 的工作机制可类比为“代码外科医生+黑客战术沙盘”。首先,它像外科医生一样对代码进行结构化“解剖”,通过静态分析构建数据流与控制流图谱,定位敏感操作节点(如数据库查询或文件读写);随后,基于漏洞模式库(如 OWASP Top 10)动态生成攻击载荷,并像沙盘推演般模拟攻击者视角,验证漏洞是否可被串联利用。例如检测到未过滤的用户输入时,工具会自动构造 SQL 注入语句并观察系统响应,而非仅标注“潜在风险”。这种将静态分析与动态验证闭环结合的设计,使其在误报率与检出率之间取得了显著优于同类工具的平衡。 整体而言,该项目以开发者友好性为出发点,通过高度自动化的白盒测试流程,将专业安全能力无缝集成到开发周期中,尤其适合敏捷团队在持续交付场景下构建内生安全防御体系。其技术路径也体现了现代 DevSecOps 中“安全左移”的核心思想——让风险暴露发生在代价最小的编码阶段。
-
ytisf/theZoo theZoo 是一个面向安全研究人员和爱好者的公开恶意软件仓库,旨在让 “实时分析” 成为可行、可获取的实践。作者将全世界已知并被正式收录的恶作剧按类型归档——如木马、后门、蠕虫等,并提供下载脚本和使用说明,以便用户直接拿到样本进行逆向或行为研究。 仓库主文件夹
contentFile(path="README.md")记录了项目结构与核心信息: 1. 目标定位 – 打破恶意软件闭门,给安全工程师、学生和技术爱好者提供一手资料。 2. 工作原理 – 每个样本都被存为单文件,并附上 SHA‑256 校验码;用户可通过官方脚本get_malware.py按需下载指定类型或全部列表的样本。 3. 使用方式 – 先克隆仓库,随后执行python get_malware.py -c <category>或者-a全部下载;下载后即可直接在沙箱、VM、分析工具(如 IDA, Ghidra 等)中进行实验。 4. 社区与贡献 – 项目欢迎新手把新的恶意样本或已更新的校验码上传至 GitHub 以外延;也鼓励讨论安全研究经验,甚至在issues提出问题、改进建议。 5. 许可证 – MIT 授权,使用者可自行修改与再分发,只需保留原作者信息。 整体来看,该项目的特色是:① 实时性——不等待官方发布即能下载;② 透明度——每个样本都配完整校验码,保证下载内容一致;③ 易用性 – 只要跑脚本即可得到任何类型恶意软件。其工作原理就是把所有已知的、被正式收录的恶作剧归档,并通过官方脚本实现按需“点对点”式下载与分析。 最终,theZoo 为安全研究提供了一个 公共、即时、可验证 的恶意样本来源,让研究者能在更短时间内获得多种 malware 并进行实验、报告或改进工具。
强化学习_ReinforcementLearning
- pytorch/rl 该项目是一个基于PyTorch的强化学习库,其核心设计理念是模块化、原始优先(Primitive-first)和Python优先(Python-first),旨在为研究者和开发者提供灵活且高效的强化学习开发工具。项目通过将算法、训练流程和环境接口解耦为独立模块,支持从基础组件构建复杂模型,例如可以单独调用策略网络、价值网络或训练循环模块,同时兼容PyTorch的动态计算图特性,允许开发者通过Python代码直接定义环境交互逻辑和奖励机制。其工作原理基于典型的强化学习框架,通过智能体(Agent)与环境(Environment)的交互收集经验数据,利用经验回放(Experience Replay)和策略优化算法(如PPO、DQN等)更新模型参数,最终通过奖励函数评估模型性能。项目特色包括对多种经典算法(如A2C、DDPG、SAC)的完整实现,提供预定义环境接口(支持Gym等主流平台)和可视化训练工具,同时文档详细说明了模块化设计的使用方式,例如通过继承基类实现自定义环境或策略网络。此外,库的设计强调研究可重复性,所有组件均支持参数化配置,便于在不同任务中快速迁移和测试。对于开发者而言,该项目降低了强化学习研究的入门门槛,同时通过Python优先的开发方式,确保代码可读性和调试便捷性,适合学术研究和工业场景的原型开发。
推荐系统
其他_推荐系统
推荐系统算法库与列表
- metarank/metarank metarank/metarank 是一个低代码的机器学习个性化排名服务,旨在通过优化文章、列表、搜索结果和推荐内容的排序方式,显著提升用户参与度。该项目基于友好的 Learn-to-Rank 引擎设计,支持开发者快速构建和部署个性化排序模型,无需深厚的机器学习专业知识。其核心特色包括:1)提供开箱即用的排名算法,如基于梯度提升的树模型(GBDT)和神经网络,适应不同数据场景;2)支持多数据源集成,可处理文本、点击行为、用户画像等结构化或非结构化数据;3)通过模块化设计实现灵活扩展,用户可自定义特征工程、模型训练流程及评估指标;4)提供可视化工具和API接口,便于与现有系统(如推荐引擎、搜索引擎)集成。工作原理上,metarank 通过分析用户交互数据(如点击率、停留时长)和内容特征,训练出能够预测用户偏好的排序模型,并实时动态调整结果顺序。项目采用 Python 编写,依赖主流 ML 框架(如 TensorFlow、PyTorch),同时提供简洁的 API 和文档,降低使用门槛。适用于电商推荐、新闻排序、搜索引擎优化等场景,尤其适合需要快速迭代模型的业务需求。开发者可通过少量代码配置数据管道和模型参数,即可完成从数据准备到部署的全流程,显著提升开发效率和模型效果。
时序与金融
时间序列
金融股票
生物医药
其他_生物医药
分子
基因
抗菌肽
细胞
药物-靶标_药物-药物_化合物-蛋白质_相互作用
药物发现_药物设计
蛋白质结构
硬件
CPU_RISC-V
硬件_其他
-
simondankelmann/Bluetooth-LE-Spam 本项目利用安卓设备内置的低功耗蓝牙 (BLE) 功能,创建类似 Flipper Zero 等设备的虚拟蓝牙设备广播。虽然市面上已有其他应用提供类似功能,但本应用旨在提升用户体验的便捷性和易用性。
-
cocotb/cocotb cocotb(Co-Verification of Chip Designs with Python)是一个基于Python的开源硬件验证框架,主要用于芯片设计的寄存器传输级(RTL)验证。项目通过Python语言编写测试用例,实现对数字电路设计的自动化测试,显著降低了验证门槛,尤其适合熟悉Python的工程师快速构建测试环境。其核心工作原理是通过Python脚本与仿真工具(如Verilator、Icarus、GHDL等)进行交互,利用Python的动态特性实现对硬件设计的实时监控和信号控制,同时支持多线程和协程(coroutines)技术,实现测试用例的并行执行与高精度时序控制。项目特色包括:1)完全开源,支持跨平台使用;2)提供丰富的接口库,可直接操作硬件设计中的信号和寄存器;3)支持多种仿真工具插件扩展,兼容主流工业级仿真器;4)集成VUnit等工具链,提升验证效率;5)通过断言机制(assertions)和覆盖率分析功能,确保设计的完整性和可靠性。cocotb被广泛应用于半导体行业,用于验证从简单逻辑门到复杂SoC(系统级芯片)的设计,尤其适合需要高频次迭代测试的场景。其社区活跃且持续更新,开发者可通过插件机制扩展功能,例如支持新的仿真工具或增加调试可视化模块。项目通过模块化设计,允许用户根据需求定制测试流程,同时提供详细的文档和示例代码,降低了学习成本,是RTL验证领域的重要开源工具。
-
google-coral/coralnpu Google Coral的coralnpu项目是一款专为边缘计算设备设计的机器学习加速器核心,旨在通过低功耗实现高效的AI推理能力。该项目的核心是Coral NPU(神经处理单元),这是一种定制的ASIC芯片,专为在资源受限的边缘设备(如Raspberry Pi等嵌入式系统)上运行AI模型而优化,能够显著降低功耗并提升处理效率。Coral NPU通过与Google Edge TPU硬件板结合使用,支持TensorFlow Lite格式的模型,使开发者能够将复杂的AI任务(如实时物体检测、图像识别)直接部署在本地设备上,无需依赖云端计算,从而减少延迟、保护隐私并提高系统可靠性。项目提供了一套完整的工具链,包括模型编译器和优化工具,可将用户训练的模型转换为Coral NPU兼容的格式,并利用硬件加速实现快速推理。其紧凑的设计和高效的能效比使其特别适合物联网、智能摄像头、工业自动化等需要实时AI处理的场景。通过将计算任务从主CPU转移至专用的NPU芯片,设备在保持低功耗的同时,能以更高速度处理复杂模型,满足边缘计算对实时性、隐私性和稳定性的需求。该项目是Google推动AI技术普及的重要组成部分,为开发者提供了从模型优化到硬件加速的完整解决方案,降低了边缘AI应用的开发门槛。
