RapidFuzz 3.0.0 и rapidfuzz-cpp 1.11.2 - библиотеки для нечёткого сравнения строк

good-penguin.png

rapidfuzz-cpp — быстрая, SIMD-оптимизированная библиотека на языке C++, реализующая несколько алгоритмов нечёткого сравнения строк и вычисления метрик:

RapidFuzz — основанная на rapidfuzz-cpp библиотека для языка Python.

Лицензия: MIT.

Изменения:

  • расстояние Хэмминга может использоваться для строк с разной длиной;
  • в rapidfuzz.fuzz и rapidfuzz.process удалена поддержка булевских функций препроцессора;
  • удалён модуль rapidfuzz.string_metric. Теперь все функции доступны в модуле rapidfuzz.distance;
  • добавлена поддержка произвольных хэшируемых последовательностей Python;
  • в process.cdist добавлена поддержка None и float("nan");
  • другие изменения.

Исправления:

  • исправлено деление на ноль в SIMD-реализации нормализованных метрик;
  • исправлена обработка score_cutoff > 1.0 в алгоритмах Джаро и Джаро — Винклер.

>>> Подробности

©  Linux.org.ru