高性能敏感词过滤工具:基于 DFA 算法实现 | 开源日报 No.256

2024-05-10 13:47:55 浏览数 (2)

picture

houbb/sensitive-wordhttps://github.com/houbb/sensitive-word

Stars: 3.4k License: Apache-2.0

sensitive-word 是一个基于 DFA 算法实现的高性能敏感词过滤工具框架。 该项目的主要功能、关键特性和核心优势包括:

  • 支持敏感词的判断、返回、脱敏等常见操作
  • 支持常见格式转换,如全角半角互换、英文大小写互换等
  • 提供丰富的检测功能,包括敏感词检测、邮箱检测和网址检测等
  • 可自定义替换策略和白名单,并支持动态更新数据
  • 高性能,使用 DFA 算法实现,在应用中无明显延迟

通过 sensitive-word 框架可以方便地进行高效准确地敏感词过滤。

microsoft/MS-DOShttps://github.com/microsoft/MS-DOS

Stars: 28.3k License: MIT

MS-DOS 是一个用于参考目的的 MS-DOS 1.25、2.0 和 4.0 的原始源代码项目。 这个项目的主要功能、关键特性和核心优势包括:

  • 提供 MS-DOS 1.25、2.0 和 4.0 的原始源代码和编译后的二进制文件。
  • 使得早期个人电脑操作系统的历史资料更易于查找和引用。
  • 通过探索和实验,满足对早期 PC 操作系统感兴趣的人的需求。

kubernetes/communityhttps://github.com/kubernetes/community

Stars: 11.7k License: Apache-2.0

community 是 Kubernetes 社区内容的集合。 该项目是 Kubernetes 社区的起点,旨在改善文档、代码和演讲等方面。其主要功能、关键特性和核心优势包括:

  • 提供多种沟通渠道,如聊天室、问题追踪系统、邮件列表和会议等;
  • 支持委员会(Committees)、特别兴趣小组(Special Interest Groups, SIGs)以及工作组(Working Groups),并提供详细说明;
  • 每个 SIG 都可以有自己的贡献政策,并提供相应的 README 或 CONTRIBUTING 文件以及邮件列表或 Slack 频道等;
  • 提供学习资源链接,帮助用户掌握相关技术知识;
  • 通过参加 SIG 会议并加入 Slack 频道或订阅邮件列表来开始贡献。同时也鼓励所有贡献者成为社区成员,并了解更多关于社区成员资格与责任方面信息。

Azure/azure-sdk-for-nethttps://github.com/Azure/azure-sdk-for-net

Stars: 5.0k License: MIT

azure-sdk-for-net 是用于 .NET 的 Azure SDK 的活跃开发仓库。 该项目的主要功能、关键特性和核心优势包括:

  • 提供了一系列服务的客户端库和管理库
  • 遵循 Azure SDK Design Guidelines for .NET
  • 共享核心功能,如 HTTP 重试、日志记录、传输协议和身份验证协议
  • 提供新版本和上一个稳定版本的客户端库以及管理库
  • 具有广泛覆盖不同服务的能力

adam-maj/tiny-gpuhttps://github.com/adam-maj/tiny-gpu

Stars: 4.7k License: NOASSERTION

picture

tiny-gpu 是一个用 Verilog 实现的最小 GPU 设计,旨在从基础开始学习 GPU 的工作原理。 这个项目的主要功能和核心优势包括:

  • 完全记录了 Verilog 代码,包含不超过 15 个文件
  • 提供了关于架构和指令集的完整文档
  • 包含了工作中的矩阵加法/乘法核心
  • 支持核心模拟和执行轨迹
  • 专注于展示 GPU 的一般原则,而非特定于图形的硬件细节
  • 探索了 GPU 的架构、并行化和内存管理等基本概念
  • 提供了对生产级 GPU 中重要优化的理解,以提高性能。

0 人点赞