- 重构 AdminManager 和 PermissionManager 以 Redis 为主要数据源 - 为所有事件模型添加 slots=True 提升性能 - 更新文档说明 Mypyc 编译注意事项 - 清理测试和调试文件 - 移动静态资源到 web_static 目录
4.1 KiB
性能优化详解
NEO Bot 实际上是python,有人说用Java可能更好。。。嗯但是镀铬酸钾不会Java,镀铬酸钾只会python,所以只能用python了
1. Playwright 页面池 (Page Pool)
痛点
之前 Bot 发图流程:
- 用户发指令。
- Bot 启动浏览器。
- 创建新页面。。
- 渲染,截图。
- 关闭浏览器。
这种模式下,发一张图至少要等 1 秒以上。。。
解决方案
BrowserManager 维护了一个页面池。
- 启动时: 自动预热 3 个页面(可配置),挂在后台待命。
- 运行时: 需要截图时,直接从池里
get_page() - 结束后: 截图完成,页面执行
about:blank洗白,然后release_page()放回池里。
收益
我不知道快了多少,也没人测试,嗯
2. Jinja2 模板缓存
痛点
每次渲染 HTML,都要从硬盘读文件,然后解析模板语法。硬盘 IO 是慢的,解析也是慢的。
解决方案
ImageManager 引入了内存缓存 _template_cache。
- 第一次读取模板后,编译好的
Template对象直接存入字典。 - 后续请求直接从内存拿对象渲染。
收益
省了硬盘IO
3. 全局 HTTP 连接复用
痛点
插件(如 B站解析)每次请求 API 都创建一个新的 aiohttp.ClientSession。
这意味着每次都要进行:DNS 解析 -> TCP 握手 -> SSL 握手。这在 HTTPS 下非常慢。
解决方案
我们在插件层面实现了 get_session()。
- 全局共享一个
ClientSession。 - 复用底层的 TCP 连接 (Keep-Alive)。
收益
实际上我也不知道,bot没高并发的实验。。。
4. orjson 极速序列化
痛点
Python 自带的 json 库性能好像不太好,特别是在处理 OneBot 这种大量 JSON 通信的场景下。
解决方案
全面替换为 orjson。
- Rust 编写
- 支持直接返回
bytes,减少内存复制。
5. Mypyc 编译 (AOT Compilation)
痛点
Python 作为一种解释型语言,在处理 CPU 密集型任务时性能较差。对于机器人框架的核心部分,如 WebSocket 消息解析、事件分发和插件管理,这些代码被高频调用,其性能直接影响机器人的响应速度和吞吐量。
解决方案
我们引入了 Mypyc,一个将类型注解的 Python 代码编译为高性能 C 扩展的工具。通过项目根目录下的 setup_mypyc.py 脚本,我们可以选择性地将核心模块编译为二进制文件(在 Windows 上是 .pyd,在 Linux 上是 .so)。
哪些模块被编译了?
core/ws.py: WebSocket 消息处理循环,这是整个机器人框架的 I/O 中枢。core/managers/*.py: 所有的核心管理器,如指令管理器、插件管理器等,负责事件分发和业务逻辑。core/utils/*.py: 高频使用的工具函数。models/*.py: 数据模型类,如消息段、发送者等。
这些高频调用的代码路径被编译为接近原生机器码的速度,极大地提升了性能。
如何编译?
在项目根目录下运行以下指令:
python setup_mypyc.py
脚本会自动查找并编译预设的模块列表。
特别注意:关于事件模型的编译
Mypyc 对 Python 的某些动态特性和高级用法支持尚不完善。在实践中,我们发现 dataclass 与 Mypyc 存在一些兼容性问题,尤其是在使用继承和某些高级特性(如 slots=True)时,可能会导致编译失败或运行时错误(例如 AttributeError: attribute '__dict__' of 'type' objects is not writable)。
- 当前状态:为了确保稳定性,
setup_mypyc.py脚本默认不编译models/events/目录下的事件模型文件。这些文件虽然也被频繁使用,但它们的结构相对复杂,与Mypyc的兼容性问题仍在探索中。 - 未来展望:我们会持续关注
Mypyc的更新,当其对dataclass的支持得到改善后,会重新尝试将事件模型加入编译列表,以实现极致的性能。
通过这种方式,我们在保证核心模块性能的同时,也维持了项目的稳定性和可维护性。