阅读(4200) (1)

PostgreSQL 限制

2021-08-17 15:50:14 更新

PostgreSQL的文本搜索特性的当前限制是:

  • 每一个词位的长度必须小于 2K 字节

  • 一个tsvector(词位 + 位置)的长度必须小于 1 兆字节

  • 词位的数量必须小于 264

  • tsvector中的位置值必须大于 0 并且小于 16,383

  • <N >(FOLLOWED BY)tsquery操作符中的匹配距离不能超过 16,384

  • 每个词位不超过 256 个位置

  • 一个tsquery中结点(词位 + 操作符)的个数必须小于 32,768

为了对比,PostgreSQL 8.1 的文档包含 10,441 个唯一词,总数 335,420 个词,并且最频繁的词postgresql在 655 个文档中被提到 6,127 次。

另一个例子 — PostgreSQL的邮件列表归档在 461,020 条消息的 57,491,343 个词位中包含 910,989 个唯一词。