Dev (#80)

* fix(discord): 修复 WebSocket 连接检测并增强跨平台文件处理修复 Discord WebSocket 连接检测逻辑，使用正确的属性检查连接状态为跨平台消息处理添加文件类型支持，并增加详细的调试日志优化附件处理逻辑，确保所有文件类型都能正确识别和转发 * feat(跨平台): 优化消息处理并添加纯文本提取功能添加 extract_text_only 函数过滤非文本标记修改翻译逻辑仅处理纯文本内容完善附件处理和消息内容拼接修复仅包含表情时的消息处理问题 * refactor(discord-cross): 使用模块专用日志记录器替换全局日志记录器将各模块中的全局日志记录器替换为模块专用日志记录器，以提供更清晰的日志来源标识同时在适配器中添加会话状态检查和重连机制，提升消息发送的可靠性 * feat(翻译): 改进翻译功能，同时显示原文和译文修改翻译功能，不再替换原文而是同时显示原文和翻译内容，方便用户对照更新 DeepSeek API 配置为官方地址和模型优化 Discord 适配器的重连逻辑，直接关闭 WebSocket 触发重连修复 Discord 频道 ID 转换逻辑，简化处理流程 * feat(cross-platform): 添加跨平台功能支持及配置优化 - 新增跨平台配置模型和全局配置支持 - 优化 Discord 适配器的连接管理和错误处理 - 添加 watchdog 和 discord.py 依赖 - 创建 DeepSeek API 配置文档 - 移除重复的同步帮助图片代码 - 改进跨平台插件配置加载逻辑 * fix(jrcd): 修正群组ID检查条件删除不再使用的示例插件文件 * feat: 改进配置加载逻辑并更新项目配置当配置文件不存在时自动生成示例配置添加pyproject.toml作为项目构建配置更新.gitignore忽略更多文件类型删除不再使用的反向WebSocket示例文件 * docs: 更新架构文档和项目结构说明添加反向WebSocket连接模式说明补充核心管理器文档更新项目结构文件在文档首页添加特色功能说明 * fix(discord): 修复WebSocket连接检查并添加错误日志 refactor(config): 更新配置文件的网络和认证信息 feat(cross-platform): 为跨平台消息处理添加异常捕获和日志 * fix(discord-cross): 修复跨平台消息处理和附件下载问题修复QQ群消息处理中的非群消息过滤问题优化Discord附件下载逻辑，使用aiohttp替代requests 修复Redis订阅任务重复创建问题调整消息格式化的embed字段处理逻辑 * feat(vectordb): 添加向量数据库支持及集成功能新增向量数据库管理器模块，支持文本的存储、检索和相似度查询添加知识库插件和AI聊天插件，利用向量数据库实现记忆功能优化跨平台翻译模块，集成向量数据库存储历史翻译记录改进消息处理逻辑，优先使用用户显示名称
2026-03-24 14:33:10 +08:00
parent 7459e4adcf
commit 8bd084ce3f
10 changed files with 415 additions and 6 deletions
--- a/core/managers/vectordb_manager.py
+++ b/core/managers/vectordb_manager.py
@@ -0,0 +1,134 @@
+# -*- coding: utf-8 -*-
+"""
+向量数据库管理器模块
+
+该模块提供了一个基于 ChromaDB 的向量数据库管理器，
+用于存储和检索文本向量，为大语言模型提供记忆能力。
+"""
+import os
+import json
+from typing import List, Dict, Any, Optional
+import chromadb
+from chromadb.config import Settings
+from core.utils.logger import ModuleLogger
+from core.utils.singleton import Singleton
+
+logger = ModuleLogger("VectorDBManager")
+
+class VectorDBManager(Singleton):
+    """
+    向量数据库管理器（单例）
+    """
+    _client = None
+    _collections = {}
+
+    def __init__(self):
+        super().__init__()
+        self.db_path = os.path.join(os.path.dirname(os.path.dirname(os.path.dirname(__file__))), "data", "vectordb")
+        os.makedirs(self.db_path, exist_ok=True)
+
+    def initialize(self):
+        """初始化 ChromaDB 客户端"""
+        if self._client is None:
+            try:
+                logger.info(f"正在初始化向量数据库，路径: {self.db_path}")
+                self._client = chromadb.PersistentClient(
+                    path=self.db_path,
+                    settings=Settings(
+                        anonymized_telemetry=False,
+                        allow_reset=True
+                    )
+                )
+                logger.success("向量数据库初始化成功！")
+            except Exception as e:
+                logger.error(f"向量数据库初始化失败: {e}")
+                self._client = None
+
+    def get_collection(self, name: str):
+        """获取或创建集合"""
+        if self._client is None:
+            self.initialize()
+            
+        if self._client is None:
+            return None
+            
+        if name not in self._collections:
+            try:
+                # 使用默认的 sentence-transformers 嵌入模型
+                self._collections[name] = self._client.get_or_create_collection(name=name)
+                logger.debug(f"已获取/创建向量集合: {name}")
+            except Exception as e:
+                logger.error(f"获取向量集合 {name} 失败: {e}")
+                return None
+                
+        return self._collections[name]
+
+    def add_texts(self, collection_name: str, texts: List[str], metadatas: List[Dict[str, Any]], ids: List[str]) -> bool:
+        """
+        向集合中添加文本
+        
+        Args:
+            collection_name: 集合名称
+            texts: 文本列表
+            metadatas: 元数据列表（用于过滤和存储额外信息）
+            ids: 唯一ID列表
+        """
+        collection = self.get_collection(collection_name)
+        if collection is None:
+            return False
+            
+        try:
+            collection.add(
+                documents=texts,
+                metadatas=metadatas,
+                ids=ids
+            )
+            logger.debug(f"成功向集合 {collection_name} 添加 {len(texts)} 条记录")
+            return True
+        except Exception as e:
+            logger.error(f"向集合 {collection_name} 添加记录失败: {e}")
+            return False
+
+    def query_texts(self, collection_name: str, query_texts: List[str], n_results: int = 5, where: Optional[Dict[str, Any]] = None) -> Dict[str, Any]:
+        """
+        查询相似文本
+        
+        Args:
+            collection_name: 集合名称
+            query_texts: 查询文本列表
+            n_results: 返回结果数量
+            where: 过滤条件
+        """
+        collection = self.get_collection(collection_name)
+        if collection is None:
+            return {"documents": [], "metadatas": [], "distances": []}
+            
+        try:
+            results = collection.query(
+                query_texts=query_texts,
+                n_results=n_results,
+                where=where
+            )
+            return results
+        except Exception as e:
+            logger.error(f"查询集合 {collection_name} 失败: {e}")
+            return {"documents": [], "metadatas": [], "distances": []}
+
+    def delete_texts(self, collection_name: str, ids: Optional[List[str]] = None, where: Optional[Dict[str, Any]] = None) -> bool:
+        """
+        删除文本
+        """
+        collection = self.get_collection(collection_name)
+        if collection is None:
+            return False
+            
+        try:
+            collection.delete(ids=ids, where=where)
+            logger.debug(f"成功从集合 {collection_name} 删除记录")
+            return True
+        except Exception as e:
+            logger.error(f"从集合 {collection_name} 删除记录失败: {e}")
+            return False
+
+# 全局向量数据库管理器实例
+vectordb_manager = VectorDBManager()