GitHub 每日趋势 - 2025年09月17日
1. microsoft/markitdown
星标数: 76.4K | Fork数: 4.2K | 语言: Python
描述: Python tool for converting files and office documents to Markdown.
翻译: 用于将文件和办公文档转换为Markdown的Python工具。
主要特性:
- 支持将多种文件格式转换为Markdown,包括PDF、Word、Excel、PowerPoint、HTML、图片、音频等
- 保持文档结构,如标题、列表、表格和链接,便于文本分析和处理
- 集成模型上下文协议(MCP)服务器,支持与大语言模型(LLM)如Claude Desktop的交互
- 无需临时文件,直接从文件流读取,提高转换效率和兼容性
- 支持批量处理ZIP文件和多种网络资源(如YouTube链接)
应用场景:
自动文档转换与整理、知识库构建、内容分析与信息提取。
2. ml-explore/mlx-lm
星标数: 2.3K | Fork数: 249 | 语言: Python
描述: Run LLMs with MLX
翻译: 使用MLX运行大型语言模型
主要特性:
- 支持多种大规模语言模型(LLMs)的一键加载与使用
- 模型量化(如4-bit)及上传到Hugging Face Hub的功能
- 支持低秩和全模型微调,包括量化模型
- 分布式推理与微调,提升性能与效率
- 提供Python API和命令行工具,便于集成与开发
应用场景:
研究与开发中的模型微调与优化、苹果设备上的文本生成与对话应用、模型上传与共享。
3. dataease/SQLBot
星标数: 2.0K | Fork数: 228 | 语言: Python
描述: 基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.
翻译: 基于大模型和 RAG 的智能问答系统。利用 RAG 的大语言模型进行文本到SQL的生成。
主要特性:
- 开箱即用的问数系统,支持配置大模型和数据源快速实现Text-to-SQL转换
- 易于集成,兼容第三方AI平台和业务系统,支持快速嵌入应用
- Based on large models and RAG technology, improve the accuracy and intelligence level of natural language inquiries
- 安全可控,提供工作空间资源隔离和细粒度数据权限管理
- 支持Docker部署,简便的安装和维护流程
应用场景:
企业数据分析、智能问答、内部数据管理和BI工具。
4. SkyworkAI/DeepResearchAgent
星标数: 2.4K | Fork数: 329 | 语言: JavaScript
描述: DeepResearchAgent is a hierarchical multi-agent system designed not only for deep research tasks but also for general-purpose task solving. The framework leverages a top-level planning agent to coordinate multiple specialized lower-level agents, enabling automated task decomposition and efficient execution across diverse and complex domains.
翻译: DeepResearchAgent 是一个分层的多智能体系统,旨在不仅用于深度研究任务,还用于通用任务解决。该框架利用一个顶层规划智能体来协调多个专业化的底层智能体,实现自动任务分解,并在多样且复杂的领域中高效执行。
主要特性:
- 层级多智能体架构实现任务自动分解与协调
- Multiple specialized sub-agents support in-depth analysis, research, and web information collection
- 动态工具调用与模型上下文管理增强任务执行能力
- Flexible scalable system architecture facilitates the integration of new agents and tools
- 支持复杂多领域任务的自动化处理与信息整合
应用场景:
科学研究、数据分析、信息检索等复杂任务场景,支持自动化任务分解与知识生成。
5. virattt/ai-hedge-fund
星标数: 40.6K | Fork数: 7.2K | 语言: Python
描述: An AI Hedge Fund Team
翻译: 人工智能对冲基金团队
主要特性:
- Multi-strategy Investment Agent: Integrates models from multiple renowned investors to simulate various investment styles and strategies
- Multidimensional analysis module: combines valuation, market sentiment, fundamentals, and technical indicators to generate trading signals
- 风险管理与组合优化:计算风险指标,设定仓位限制,辅助决策
- 教育与研究用途:仅用于学习和研究,不支持实际交易
- 模块化设计:包括估值、情绪、基本面、技术分析等多个独立代理
应用场景:
金融研究与策略学习、量化投资探索、投资组合优化与风险管理。
6. ccxt/ccxt
星标数: 38.7K | Fork数: 8.2K | 语言: Python
描述: A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go
翻译: 一个支持超过100个交易所的加密货币交易API,使用JavaScript / TypeScript / Python / C# / PHP / Go开发
主要特性:
- 支持超过100个加密货币交易所的API集成
- 提供完整的公开和私有API接口,支持交易和账户管理
- 数据标准化,便于跨交易所的市场分析和套利
- 多语言支持,包括JavaScript、Python、C#、PHP、Go等平台
- Suitable for algorithm trading, strategy backtesting, trading robot development, and data analysis
应用场景:
自动化交易策略开发、市场数据分析、跨交易所套利与交易机器人。
7. HKUDS/DeepCode
星标数: 6.7K | Fork数: 896 | 语言: Python
描述: "DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"
翻译: DeepCode:开放式代理编码(Paper2Code 与 Text2Web 及 Text2Backend)
主要特性:
- Multi-Agent Collaboration Code Generation Capability
- 支持文本到代码、网页和后端代码的自动生成
- 自主编码系统基于开源模型
- 可扩展的多模态输入处理(如文本指令)
- 强调开放式、智能化的编码流程
应用场景:
自动软件开发与原型快速搭建、智能辅助编程、自然语言驱动的代码生成。
8. PaddlePaddle/PaddleOCR
星标数: 54.3K | Fork数: 8.6K | 语言: Python
描述: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages.
翻译: 将任何PDF或图像文档转换为您的AI结构化数据。一个功能强大、轻量级的光学字符识别工具包,弥合图像/PDF与大型语言模型之间的差距。支持80多种语言。
主要特性:
- 多语言支持(支持80+种语言)
- 高精度文本识别与提取
- 适应多种文档类型(PDF、图片)
- 结构化数据输出(如JSON、Markdown)
- 轻量级且易于集成的光学字符识别工具箱
应用场景:
文档数字化与信息提取、智能文档管理、自动化处理。
9. Plachtaa/seed-vc
星标数: 3.2K | Fork数: 372 | 语言: Python
描述: zero-shot voice conversion & singing voice conversion, with real-time support
翻译: 零样本语音转换与歌唱语音转换,支持实时处理
主要特性:
- 零样本人声转换:无需训练即可实现不同声音之间的转换,支持多种声音类型,包括歌声。
- 实时语音转换:具备低延迟处理能力,适用于在线会议、直播和游戏场景。
- Few-shot data fine-tuning: personalized customization can be achieved with only a minimal amount of reference speech, enabling rapid training and low cost.
- Multi-model support: 提供多种预训练模型,满足不同应用需求,具有灵活的配置选项。
- Open source and user-friendly: supports installation in Python environment, provides detailed documentation and demonstrations, facilitating integration and usage by developers.
应用场景:
虚拟主播、在线会议、娱乐内容创作,满足个性化需求和高效实时转换。
10. BasedHardware/omi
星标数: 6.6K | Fork数: 975 | 语言: C
描述: AI wearables. Put it on, speak, transcribe, automatically
翻译: AI可穿戴设备。佩戴、说话、转录、自动完成
主要特性:
- 实时高质量语音转录与总结
- 便携式穿戴设备,支持语音交互
- 与手机无缝连接,自动同步数据
- 开源软件平台,支持定制与扩展
- 长时间低功耗蓝牙连接,适合全天佩戴
应用场景:
会议记录、个人语音笔记、聊天内容整理。
11. mnh-jansson/open-battery-information
星标数: 565 | Fork数: 110 | 语言: C++
描述:
翻译:
主要特性:
- 提供电池信息工具以辅助维修
- 支持多种电池BMS状态检测与诊断
- 可绕过制造商锁定的BMS保护功能
- 兼容Arduino硬件和Python软件实现
- 提供预编译二进制和源码安装方式
应用场景:
电池维护与检测、BMS保护功能解除、电池性能诊断与优化。
12. ArthurBrussee/brush
星标数: 2.5K | Fork数: 111 | 语言: Rust
描述: 3D Reconstruction for all
翻译: 全域三维重建
主要特性:
- 3D reconstruction and rendering based on Gaussian point clouds, supporting real-time interaction
- 支持多平台,包括桌面、移动端和浏览器,无依赖部署
- 支持使用COLMAP和Nerfstudio格式进行训练,支持遮罩和透明图像
- 提供Web端演示和流式加载功能,便于展示和分享3D场景
- 具备命令行工具和集成Rerun可视化,方便调试和监控
应用场景:
快速场景重建与交互展示、虚拟现实内容开发、跨平台三维可视化与研究。
13. PowerShell/PowerShell
星标数: 50.0K | Fork数: 7.9K | 语言: C#
描述: PowerShell for every system!
翻译: PowerShell 适用于每个系统!
主要特性:
- 跨平台支持(Windows、Linux、macOS)
- 丰富的自动化和配置管理功能
- 结构化数据处理(JSON、CSV、XML等)
- 集成REST API和对象模型
- 命令行界面与脚本语言结合
应用场景:
系统管理与自动化任务、配置管理、数据处理与分析。
14. ItzCrazyKns/Perplexica
星标数: 25.1K | Fork数: 2.6K | 语言: TypeScript
描述: Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI
翻译: Perplexica 是一款由人工智能驱动的搜索引擎。它是 Perplexity AI 的开源替代方案。
主要特性:
- 开源的AI搜索引擎,支持多种本地大模型(如Qwen、Llama等)
- 两种主要模式:增强搜索(Copilot模式)和普通搜索
- Multiple dedicated focus modes to meet different types of query requirements
- 集成SearxNG实现实时、隐私保护的网页搜索
- 支持API调用和网络暴露,便于定制和部署
应用场景:
学术研究、内容创作、技术支持,满足多样化的隐私与效率需求。
15. TheAlgorithms/Python
星标数: 207.4K | Fork数: 47.8K | 语言: Python
描述: All Algorithms implemented in Python
翻译: 所有在Python中实现的算法
主要特性:
- 涵盖多种经典算法的Python实现
- 以学习和教育为主要目的的代码示例
- 开源社区支持与贡献指南
- 结构清晰的目录便于导航
- 集成持续集成和代码风格检测工具
应用场景:
算法教学与演示、算法研究与开发、编程练习与竞赛参考。