跳转至

GitHub 每日趋势 - 2025年09月17日

1. microsoft/markitdown

星标数: 76.4K | Fork数: 4.2K | 语言: Python

描述: Python tool for converting files and office documents to Markdown.

翻译: 用于将文件和办公文档转换为Markdown的Python工具。

主要特性:

  • 支持将多种文件格式转换为Markdown,包括PDF、Word、Excel、PowerPoint、HTML、图片、音频等
  • 保持文档结构,如标题、列表、表格和链接,便于文本分析和处理
  • 集成模型上下文协议(MCP)服务器,支持与大语言模型(LLM)如Claude Desktop的交互
  • 无需临时文件,直接从文件流读取,提高转换效率和兼容性
  • 支持批量处理ZIP文件和多种网络资源(如YouTube链接)

应用场景:

自动文档转换与整理、知识库构建、内容分析与信息提取。


2. ml-explore/mlx-lm

星标数: 2.3K | Fork数: 249 | 语言: Python

描述: Run LLMs with MLX

翻译: 使用MLX运行大型语言模型

主要特性:

  • 支持多种大规模语言模型(LLMs)的一键加载与使用
  • 模型量化(如4-bit)及上传到Hugging Face Hub的功能
  • 支持低秩和全模型微调,包括量化模型
  • 分布式推理与微调,提升性能与效率
  • 提供Python API和命令行工具,便于集成与开发

应用场景:

研究与开发中的模型微调与优化、苹果设备上的文本生成与对话应用、模型上传与共享。


3. dataease/SQLBot

星标数: 2.0K | Fork数: 228 | 语言: Python

描述: 基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.

翻译: 基于大模型和 RAG 的智能问答系统。利用 RAG 的大语言模型进行文本到SQL的生成。

主要特性:

  • 开箱即用的问数系统,支持配置大模型和数据源快速实现Text-to-SQL转换
  • 易于集成,兼容第三方AI平台和业务系统,支持快速嵌入应用
  • Based on large models and RAG technology, improve the accuracy and intelligence level of natural language inquiries
  • 安全可控,提供工作空间资源隔离和细粒度数据权限管理
  • 支持Docker部署,简便的安装和维护流程

应用场景:

企业数据分析、智能问答、内部数据管理和BI工具。


4. SkyworkAI/DeepResearchAgent

星标数: 2.4K | Fork数: 329 | 语言: JavaScript

描述: DeepResearchAgent is a hierarchical multi-agent system designed not only for deep research tasks but also for general-purpose task solving. The framework leverages a top-level planning agent to coordinate multiple specialized lower-level agents, enabling automated task decomposition and efficient execution across diverse and complex domains.

翻译: DeepResearchAgent 是一个分层的多智能体系统,旨在不仅用于深度研究任务,还用于通用任务解决。该框架利用一个顶层规划智能体来协调多个专业化的底层智能体,实现自动任务分解,并在多样且复杂的领域中高效执行。

主要特性:

  • 层级多智能体架构实现任务自动分解与协调
  • Multiple specialized sub-agents support in-depth analysis, research, and web information collection
  • 动态工具调用与模型上下文管理增强任务执行能力
  • Flexible scalable system architecture facilitates the integration of new agents and tools
  • 支持复杂多领域任务的自动化处理与信息整合

应用场景:

科学研究、数据分析、信息检索等复杂任务场景,支持自动化任务分解与知识生成。


5. virattt/ai-hedge-fund

星标数: 40.6K | Fork数: 7.2K | 语言: Python

描述: An AI Hedge Fund Team

翻译: 人工智能对冲基金团队

主要特性:

  • Multi-strategy Investment Agent: Integrates models from multiple renowned investors to simulate various investment styles and strategies
  • Multidimensional analysis module: combines valuation, market sentiment, fundamentals, and technical indicators to generate trading signals
  • 风险管理与组合优化:计算风险指标,设定仓位限制,辅助决策
  • 教育与研究用途:仅用于学习和研究,不支持实际交易
  • 模块化设计:包括估值、情绪、基本面、技术分析等多个独立代理

应用场景:

金融研究与策略学习、量化投资探索、投资组合优化与风险管理。


6. ccxt/ccxt

星标数: 38.7K | Fork数: 8.2K | 语言: Python

描述: A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go

翻译: 一个支持超过100个交易所的加密货币交易API,使用JavaScript / TypeScript / Python / C# / PHP / Go开发

主要特性:

  • 支持超过100个加密货币交易所的API集成
  • 提供完整的公开和私有API接口,支持交易和账户管理
  • 数据标准化,便于跨交易所的市场分析和套利
  • 多语言支持,包括JavaScript、Python、C#、PHP、Go等平台
  • Suitable for algorithm trading, strategy backtesting, trading robot development, and data analysis

应用场景:

自动化交易策略开发、市场数据分析、跨交易所套利与交易机器人。


7. HKUDS/DeepCode

星标数: 6.7K | Fork数: 896 | 语言: Python

描述: "DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"

翻译: DeepCode:开放式代理编码(Paper2Code 与 Text2Web 及 Text2Backend)

主要特性:

  • Multi-Agent Collaboration Code Generation Capability
  • 支持文本到代码、网页和后端代码的自动生成
  • 自主编码系统基于开源模型
  • 可扩展的多模态输入处理(如文本指令)
  • 强调开放式、智能化的编码流程

应用场景:

自动软件开发与原型快速搭建、智能辅助编程、自然语言驱动的代码生成。


8. PaddlePaddle/PaddleOCR

星标数: 54.3K | Fork数: 8.6K | 语言: Python

描述: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages.

翻译: 将任何PDF或图像文档转换为您的AI结构化数据。一个功能强大、轻量级的光学字符识别工具包,弥合图像/PDF与大型语言模型之间的差距。支持80多种语言。

主要特性:

  • 多语言支持(支持80+种语言)
  • 高精度文本识别与提取
  • 适应多种文档类型(PDF、图片)
  • 结构化数据输出(如JSON、Markdown)
  • 轻量级且易于集成的光学字符识别工具箱

应用场景:

文档数字化与信息提取、智能文档管理、自动化处理。


9. Plachtaa/seed-vc

星标数: 3.2K | Fork数: 372 | 语言: Python

描述: zero-shot voice conversion & singing voice conversion, with real-time support

翻译: 零样本语音转换与歌唱语音转换,支持实时处理

主要特性:

  • 零样本人声转换:无需训练即可实现不同声音之间的转换,支持多种声音类型,包括歌声。
  • 实时语音转换:具备低延迟处理能力,适用于在线会议、直播和游戏场景。
  • Few-shot data fine-tuning: personalized customization can be achieved with only a minimal amount of reference speech, enabling rapid training and low cost.
  • Multi-model support: 提供多种预训练模型,满足不同应用需求,具有灵活的配置选项。
  • Open source and user-friendly: supports installation in Python environment, provides detailed documentation and demonstrations, facilitating integration and usage by developers.

应用场景:

虚拟主播、在线会议、娱乐内容创作,满足个性化需求和高效实时转换。


10. BasedHardware/omi

星标数: 6.6K | Fork数: 975 | 语言: C

描述: AI wearables. Put it on, speak, transcribe, automatically

翻译: AI可穿戴设备。佩戴、说话、转录、自动完成

主要特性:

  • 实时高质量语音转录与总结
  • 便携式穿戴设备,支持语音交互
  • 与手机无缝连接,自动同步数据
  • 开源软件平台,支持定制与扩展
  • 长时间低功耗蓝牙连接,适合全天佩戴

应用场景:

会议记录、个人语音笔记、聊天内容整理。


11. mnh-jansson/open-battery-information

星标数: 565 | Fork数: 110 | 语言: C++

描述:

翻译:

主要特性:

  • 提供电池信息工具以辅助维修
  • 支持多种电池BMS状态检测与诊断
  • 可绕过制造商锁定的BMS保护功能
  • 兼容Arduino硬件和Python软件实现
  • 提供预编译二进制和源码安装方式

应用场景:

电池维护与检测、BMS保护功能解除、电池性能诊断与优化。


12. ArthurBrussee/brush

星标数: 2.5K | Fork数: 111 | 语言: Rust

描述: 3D Reconstruction for all

翻译: 全域三维重建

主要特性:

  • 3D reconstruction and rendering based on Gaussian point clouds, supporting real-time interaction
  • 支持多平台,包括桌面、移动端和浏览器,无依赖部署
  • 支持使用COLMAP和Nerfstudio格式进行训练,支持遮罩和透明图像
  • 提供Web端演示和流式加载功能,便于展示和分享3D场景
  • 具备命令行工具和集成Rerun可视化,方便调试和监控

应用场景:

快速场景重建与交互展示、虚拟现实内容开发、跨平台三维可视化与研究。


13. PowerShell/PowerShell

星标数: 50.0K | Fork数: 7.9K | 语言: C#

描述: PowerShell for every system!

翻译: PowerShell 适用于每个系统!

主要特性:

  • 跨平台支持(Windows、Linux、macOS)
  • 丰富的自动化和配置管理功能
  • 结构化数据处理(JSON、CSV、XML等)
  • 集成REST API和对象模型
  • 命令行界面与脚本语言结合

应用场景:

系统管理与自动化任务、配置管理、数据处理与分析。


14. ItzCrazyKns/Perplexica

星标数: 25.1K | Fork数: 2.6K | 语言: TypeScript

描述: Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI

翻译: Perplexica 是一款由人工智能驱动的搜索引擎。它是 Perplexity AI 的开源替代方案。

主要特性:

  • 开源的AI搜索引擎,支持多种本地大模型(如Qwen、Llama等)
  • 两种主要模式:增强搜索(Copilot模式)和普通搜索
  • Multiple dedicated focus modes to meet different types of query requirements
  • 集成SearxNG实现实时、隐私保护的网页搜索
  • 支持API调用和网络暴露,便于定制和部署

应用场景:

学术研究、内容创作、技术支持,满足多样化的隐私与效率需求。


15. TheAlgorithms/Python

星标数: 207.4K | Fork数: 47.8K | 语言: Python

描述: All Algorithms implemented in Python

翻译: 所有在Python中实现的算法

主要特性:

  • 涵盖多种经典算法的Python实现
  • 以学习和教育为主要目的的代码示例
  • 开源社区支持与贡献指南
  • 结构清晰的目录便于导航
  • 集成持续集成和代码风格检测工具

应用场景:

算法教学与演示、算法研究与开发、编程练习与竞赛参考。