Dev (#44)

* 滚木 * feat: 重构核心架构，增强类型安全与插件管理本次提交对核心模块进行了深度重构，引入 Pydantic 增强配置管理的类型安全性，并全面优化了插件管理系统。主要变更详情： 1. 核心架构与配置 - 重构配置加载模块：引入 Pydantic 模型 (`core/config_models.py`)，提供严格的配置项类型检查、验证及默认值管理。 - 统一模块结构：规范化模块导入路径，移除冗余的 `__init__.py` 文件，提升项目结构的清晰度。 - 性能优化：集成 Redis 缓存支持 (`RedisManager`)，有效降低高频 API 调用开销，提升响应速度。 2. 插件系统升级 - 实现热重载机制：新增插件文件变更监听功能，支持开发过程中自动重载插件，提升开发效率。 - 优化生命周期管理：改进插件加载与卸载逻辑，支持精确卸载指定插件及其关联的命令、事件处理器和定时任务。 3. 功能特性增强 - 新增媒体 API：引入 `MediaAPI` 模块，封装图片、语音等富媒体资源的获取与处理接口。 - 完善权限体系：重构权限管理系统，实现管理员与操作员的分级控制，支持更细粒度的命令权限校验。 4. 代码质量与稳定性 - 全面类型修复：解决 `mypy` 静态类型检查发现的大量类型错误（包括 `CommandManager`、`EventFactory` 及 `Bot` API 签名不匹配问题）。 - 增强错误处理：优化消息处理管道的异常捕获机制，完善关键路径的日志记录，提升系统运行稳定性。 * feat: 添加测试用例并优化代码结构 refactor(permission_manager): 调整初始化顺序和逻辑 fix(admin_manager): 修复初始化逻辑和目录创建问题 feat(ws): 优化Bot实例初始化条件 feat(message): 增强MessageSegment功能并添加测试 feat(events): 支持字符串格式的消息解析 test: 添加核心功能测试用例 refactor(plugin_manager): 改进插件路径处理 style: 清理无用导入和代码 chore: 更新依赖项 * refactor(handler): 移除TYPE_CHECKING并直接导入Bot类简化类型注解，直接导入Bot类而非使用TYPE_CHECKING条件导入，提高代码可读性和维护性 * fix(command_manager): 修复插件卸载时元信息移除不精确的问题修复 CommandManager 中 unload_plugin 方法移除插件元信息时使用 startswith 导致可能误删其他插件的问题，改为精确匹配同时调整相关测试用例验证精确匹配行为 * refactor: 清理未使用的导入和更新文档结构 docs: 添加config_models.py到项目结构文档 docs: 调整数据目录位置到core/data下 docs: 更新权限管理器文档描述 * 文档更新 * 更新thpic插件支持一次返回多张图 * feat: 添加测试覆盖率并修复相关问题 refactor(redis_manager): 移除冗余的ConnectionError处理 refactor(event_handler): 优化Bot类型注解 refactor(factory): 移除未使用的GroupCardNoticeEvent test: 添加全面的单元测试覆盖 - 添加test_import.py测试模块导入 - 添加test_debug.py测试插件加载调试 - 添加test_plugin_error.py测试错误处理 - 添加test_config_loader.py测试配置加载 - 添加test_redis_manager.py测试Redis管理 - 添加test_bot.py测试Bot功能 - 扩展test_models.py测试消息模型 - 添加test_plugin_manager_coverage.py测试插件管理 - 添加test_executor.py测试代码执行器 - 添加test_ws.py测试WebSocket - 添加test_api.py测试API接口 - 添加test_core_managers.py测试核心管理模块 fix(plugin_manager): 修复插件加载日志变量问题覆盖率已到达86%（忽略插件） * 更新/help指令，现在会发送图片 * feat(help): 重构帮助系统为图片渲染模式添加浏览器管理器和图片管理器，用于通过 Playwright 渲染帮助菜单为图片重构命令管理器以支持图片缓存和同步功能添加 HTML 模板用于帮助菜单渲染 * build: 更新依赖文件 requirements.txt * build: 更新依赖文件 * feat: 添加性能优化和架构文档，更新依赖和核心模块 refactor(browser_manager): 实现页面池机制以提升性能 refactor(image_manager): 添加模板缓存并集成页面池 refactor(bili_parser): 迁移到异步HTTP请求并实现会话复用 docs: 新增性能优化、架构设计和最佳实践文档 chore: 更新requirements.txt添加新依赖 * docs: 更新文档内容并优化语言风格重构所有文档内容，使用更简洁直接的语言风格更新架构、插件开发、部署等核心文档优化代码示例和图表说明统一术语和格式规范 * docs: 更新文档内容，简化语言并修正格式 - 简化插件开发指南中的描述，移除冗余内容 - 调整部署文档中的Python版本说明 - 优化最佳实践文档的措辞和格式 - 更新性能优化文档，删除不准确的数据 - 重构核心概念文档，使用更简洁的语言 - 修正README中的项目描述和技术栈说明 - 更新快速上手文档，简化安装步骤 - 调整事件流转文档的描述方式 - 简化架构文档内容 - 更新指令处理文档，添加参数注入示例 - 优化单例管理器文档的表述 * refactor(core): 优化权限管理和事件模型 - 重构 AdminManager 和 PermissionManager 以 Redis 为主要数据源 - 为所有事件模型添加 slots=True 提升性能 - 更新文档说明 Mypyc 编译注意事项 - 清理测试和调试文件 - 移动静态资源到 web_static 目录 * feat: 添加模块编译脚本和导出依赖功能 refactor(events): 移除数据类的slots参数以提升兼容性 build: 更新requirements.txt依赖列表 * docs: 更新性能优化文档并修复命令管理器帮助输出更新性能优化相关文档，详细说明 Python 3.14 JIT 编译器的使用方法和原理，补充与 Mypyc 的互补策略。同时修复命令管理器中帮助信息的输出方式，移除图片发送仅保留文本输出。调整部署文档结构，明确两种性能优化方案（AOT 和 JIT）的配置方法和适用场景。完善架构文档中关于 JIT 的原理和启用方式说明。 * feat(help): 重构帮助菜单界面并优化样式 refactor(bili_parser): 修复 API 响应 content-type 问题 fix(command_manager): 添加帮助图片获取的错误处理 docs(deployment): 简化部署文档并移除 JIT 相关内容 * feat: 新增自动同意请求插件和API文档 docs: 更新文档结构和内容 * refactor(scripts): 重构并优化脚本文件结构 feat(scripts): 添加Python环境检查脚本 feat(scripts): 增强依赖导出脚本功能 perf(plugins/bili_parser): 优化B站解析器性能和代码结构 style(plugins/bili_parser): 统一代码风格和常量命名 * fix(scripts): 修复编码问题并添加错误追踪在compile_machine_code.py中添加utf-8编码设置以避免潜在编码问题添加traceback.print_exc()以在编译失败时打印完整错误堆栈更新.gitignore以忽略config.toml文件 * feat(性能分析): 实现性能分析工具模块并添加相关测试添加性能分析工具模块，包括时间测量、内存分析和性能统计功能添加测试文件和示例配置，完善性能分析工具的使用场景在工具模块中实现单例装饰器并导出到__init__.py * feat(douyin_parser): 新增抖音视频解析插件 refactor(performance): 移除未使用的asyncio导入并优化性能测试 style(compile_modules): 修正字符串引号格式 chore: 删除废弃的编译脚本和临时文件 fix(bili_parser): 增强B站链接解析的健壮性 refactor(singleton): 重构单例模式实现 docs: 更新配置文件和事件模型注释 * feat: 添加抖音视频解析插件并优化代码结构添加抖音视频解析插件，支持自动解析抖音分享链接并提取视频信息。优化现有代码结构，包括： - 重构单例模式实现 - 移除未使用的导入和文件 - 修复性能测试脚本中的异步调用 - 优化消息事件模型中的权限常量定义 - 改进编译脚本的错误处理 - 增强B站解析插件的稳定性同时清理了多个废弃脚本和临时文件，提升代码可维护性。 * 1 * Delete core/data/temp/help_menu.png * fix(权限管理): 增强权限检查的类型安全并修复权限引用修复权限检查中可能传入非Permission类型导致的错误，将echo插件的权限引用从MessageEvent.ADMIN迁移到Permission.ADMIN * redis取消tls * feat(github_parser): 添加GitHub仓库信息查询功能 - 新增github_parser插件，支持通过命令或自动解析链接查询GitHub仓库信息 - 添加github_repo.html模板用于渲染仓库信息图片 - 优化图片管理器支持高质量截图和CSS缩放 - 重构消息事件类权限常量定义方式 - 更新帮助页面样式为三列布局并优化响应式设计 * feat(web_parser): 新增通用web链接解析插件框架 refactor: 重构B站、抖音、GitHub解析器为模块化结构 fix(executor): 增强docker容器错误处理和回调稳定性 style(templates): 优化帮助页面和代码执行结果的样式 perf(web_parser): 添加API缓存和消息去重机制 docs: 更新插件元信息和注释 chore: 移除旧的独立解析器插件文件 --------- Co-authored-by: baby20162016 <2185823427@qq.com> Co-authored-by: web vscode <youremail@example.com>
2026-01-22 01:59:05 +08:00
parent 210aca54e1
commit 8a6af1ea2a
12 changed files with 1665 additions and 767 deletions
--- a/plugins/web_parser/parsers/douyin.py
+++ b/plugins/web_parser/parsers/douyin.py
@@ -0,0 +1,261 @@
+# -*- coding: utf-8 -*-
+import re
+import json
+import aiohttp
+from typing import Optional, Dict, Any, List
+
+from core.utils.logger import logger
+from models import MessageEvent, MessageSegment
+from ..base import BaseParser
+from ..utils import extract_original_text
+from cachetools import TTLCache
+
+
+class DouyinParser(BaseParser):
+    """
+    抖音视频解析器
+    """
+    
+    def __init__(self):
+        super().__init__()
+        self.name = "抖音解析器"
+        self.url_pattern = re.compile(r"https?://v\.douyin\.com/[a-zA-Z0-9_]+/?", re.IGNORECASE)
+        self.short_pattern = re.compile(r"(?:https?://)?v\.douyin\.com/[a-zA-Z0-9_]+/?", re.IGNORECASE)
+        self.nickname = "抖音视频解析"
+        # 消息去重缓存
+        self.processed_messages: TTLCache[int, bool] = TTLCache(maxsize=100, ttl=10)
+    
+    async def parse(self, url: str) -> Optional[Dict[str, Any]]:
+        """
+        解析抖音视频信息
+        
+        Args:
+            url (str): 抖音视频URL
+            
+        Returns:
+            Optional[Dict[str, Any]]: 视频信息字典，如果失败则返回None
+        """
+        try:
+            # 使用第三方API解析抖音视频
+            api_url = f"http://api.xhus.cn/api/douyin?url={url}"
+            
+            session = self.get_session()
+            async with session.get(api_url, headers=self.HEADERS, timeout=10) as response:
+                if response.status != 200:
+                    logger.error(f"[{self.name}] API请求失败，状态码: {response.status}")
+                    return None
+                    
+                response_data = await response.json()
+            
+            if not isinstance(response_data, dict):
+                logger.error(f"[{self.name}] API返回格式错误: {response_data}")
+                return None
+                
+            if response_data.get("code") != 200:
+                logger.error(f"[{self.name}] API返回错误: {response_data}")
+                return None
+                
+            data = response_data.get("data", {})
+            if not data:
+                logger.error(f"[{self.name}] API返回数据为空")
+                return None
+                
+            # 转换API响应格式
+            return {
+                "type": "video" if not data.get("images") or not isinstance(data.get("images"), list) else "image",
+                "video_url": data.get("url", ""),
+                "video_url_HQ": data.get("url", ""),
+                "nickname": data.get("author", "未知作者"),
+                "desc": data.get("title", "无描述"),
+                "aweme_id": data.get("uid", ""),
+                "like": data.get("like", 0),
+                "cover": data.get("cover", ""),
+                "time": data.get("time", 0),
+                "author_avatar": data.get("avatar", ""),
+                "music": data.get("music", {}),
+            }
+            
+        except (aiohttp.ClientError, KeyError, AttributeError, json.JSONDecodeError) as e:
+            logger.error(f"[{self.name}] 解析抖音视频信息失败: {e}")
+            logger.debug(f"失败的URL: {url}")
+        except Exception as e:
+            logger.error(f"[{self.name}] 解析抖音视频时发生未知错误: {e}")
+            logger.debug(f"失败的URL: {url}")
+        
+        return None
+    
+    async def get_real_url(self, short_url: str) -> Optional[str]:
+        """
+        获取抖音短链接的真实URL
+        
+        Args:
+            short_url (str): 抖音短链接
+            
+        Returns:
+            Optional[str]: 真实URL，如果失败则返回None
+        """
+        try:
+            # 首先尝试获取重定向后的URL
+            async with aiohttp.ClientSession() as session:
+                # 添加更多头部信息模拟移动端访问
+                mobile_headers = self.HEADERS.copy()
+                mobile_headers.update({
+                    'Sec-Fetch-Dest': 'document',
+                    'Sec-Fetch-Mode': 'navigate',
+                    'Sec-Fetch-Site': 'none',
+                    'Cache-Control': 'max-age=0',
+                    # 模拟移动设备的额外头部
+                    'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 16_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.0 Mobile/15E148 Safari/604.1',
+                    'X-Requested-With': 'XMLHttpRequest',
+                    'Referer': 'https://www.douyin.com/'
+                })
+                
+                async with session.get(short_url, headers=mobile_headers, allow_redirects=True, timeout=10) as response:
+                    redirected_url = str(response.url)
+                    
+                    # 检查重定向后的URL是否包含视频ID
+                    if 'video/' in redirected_url or '/note/' in redirected_url:
+                        logger.info(f"[{self.name}] 重定向后的视频URL: {redirected_url}")
+                        return redirected_url
+                    elif 'share_item' in redirected_url:
+                        logger.info(f"[{self.name}] 重定向后的分享URL: {redirected_url}")
+                        return redirected_url
+                    else:
+                        logger.warning(f"[{self.name}] 重定向到了非预期页面: {redirected_url}")
+                        return redirected_url
+                        
+        except Exception as e:
+            logger.error(f"[{self.name}] 获取真实URL失败: {e}")
+        return None
+    
+    async def format_response(self, event: MessageEvent, data: Dict[str, Any]) -> List[Any]:
+        """
+        格式化抖音视频响应消息
+        
+        Args:
+            event (MessageEvent): 消息事件对象
+            data (Dict[str, Any]): 视频信息
+            
+        Returns:
+            List[Any]: 消息段列表
+        """
+        # 构建回复消息，包含原分享中的文本内容（如果有）
+        original_text = extract_original_text(event.message, self.url_pattern)
+
+        # 构建回复消息
+        text_parts = ["抖音视频解析"]
+        text_parts.append("--------------------")
+        
+        if original_text:
+            text_parts.append(f" 分享内容: {original_text}")
+            text_parts.append("--------------------")
+        
+        text_parts.append(f" 作者: {data['nickname']}")
+        text_parts.append(f" 抖音号: {data['aweme_id']}")
+        text_parts.append(f" 标题: {data['desc']}")
+        text_parts.append(f" 点赞: {self.format_count(data['like'])}")
+        text_parts.append(f" 类型: {data['type']}")
+        
+        # 如果是音乐，添加音乐信息
+        if data.get('music'):
+            music_info = data['music']
+            text_parts.append("--------------------")
+            text_parts.append(" 背景音乐:")
+            text_parts.append(f"    标题: {music_info.get('title', '')}")
+            text_parts.append(f"    作者: {music_info.get('author', '')}")
+        
+        text_parts.append("--------------------")
+        
+        text_message = "\n".join(text_parts)
+        
+        # 准备转发消息节点
+        nodes = []
+
+        # 添加文本信息节点
+        text_node = event.bot.build_forward_node(
+            user_id=event.self_id, 
+            nickname=self.nickname, 
+            message=text_message
+        )
+        nodes.append(text_node)
+
+        # 添加封面图片节点（如果有）
+        if data.get('cover'):
+            try:
+                cover_node = event.bot.build_forward_node(
+                    user_id=event.self_id, 
+                    nickname=self.nickname, 
+                    message=[
+                        MessageSegment.text("抖音视频封面：\n"),
+                        MessageSegment.image(data['cover'])
+                    ]
+                )
+                nodes.append(cover_node)
+            except Exception as e:
+                logger.warning(f"[{self.name}] 无法添加封面图片: {e}")
+
+        # 添加作者头像节点（如果有）
+        if data.get('author_avatar'):
+            try:
+                avatar_node = event.bot.build_forward_node(
+                    user_id=event.self_id, 
+                    nickname=self.nickname, 
+                    message=[
+                        MessageSegment.text("作者头像：\n"),
+                        MessageSegment.image(data['author_avatar'])
+                    ]
+                )
+                nodes.append(avatar_node)
+            except Exception as e:
+                logger.warning(f"[{self.name}] 无法添加作者头像: {e}")
+
+        # 尝试添加视频直链（单独节点）
+        video_success = False
+        try:
+            if data.get('video_url'):
+                video_url = data.get('video_url', '')
+                # 检查视频类型
+                if data.get('type') == 'video':
+                    video_message = MessageSegment.video(video_url)
+                    video_type_text = "视频直链："
+                else:  # image类型
+                    video_message = MessageSegment.image(video_url)  # 单个图片
+                    video_type_text = "图集首图："
+                    
+                # 构建视频/图片节点
+                video_node = event.bot.build_forward_node(
+                    user_id=event.self_id, 
+                    nickname=self.nickname, 
+                    message=[
+                        MessageSegment.text(video_type_text + "\n"),
+                        video_message
+                    ]
+                )
+                nodes.append(video_node)
+                video_success = True
+        except Exception as e:
+            logger.error(f"[{self.name}] 无法添加视频/图片: {e}")
+            
+        # 如果无法添加视频，添加提示信息
+        if not video_success:
+            no_video_node = event.bot.build_forward_node(
+                user_id=event.self_id, 
+                nickname=self.nickname, 
+                message="视频解析成功，但无法获取直链或播放视频。"
+            )
+            nodes.append(no_video_node)
+
+        return nodes
+    
+    def should_handle_url(self, url: str) -> bool:
+        """
+        判断是否应该处理该URL
+        
+        Args:
+            url (str): URL
+            
+        Returns:
+            bool: 是否应该处理
+        """
+        # 检查是否是抖音相关域名
+        return ('douyin.com' in url or bool(self.url_pattern.search(url)) or bool(self.short_pattern.search(url)))