Algoritmos de clasificación para búscar y categorizar preguntas.
- Búsqueda de textos por similitud semántica.
- Etiquetado de textos en base a categorías entrenables.
Algoritmos de procesamiento de lenguaje natural desarrollado en Python que permite la búsqueda de texto por similitud semántica y etiquetar textos en base a categorías entrenables. Esta herramienta analiza las preguntas recibidas al gobierno evitando la duplicidad de preguntas y categorizándolas por temática.
Esta herramienta la desarrolló la Dirección Nacional de Datos e Información Pública del Ministerio de Modernización de la Presidencia de Argentina. Surgió para asistir a la Secretaría de Relaciones Parlamentarias y Administración de la Jefaura de Gabinete en la creación de informes y resolución de preguntas.
Para ello, el equipo de la Dirección Nacional de Datos e Información Pública creó estos algoritmos, que integrados a una interfaz interna asisten en la búsqueda y categorización de las preguntas que componen los informes de la secretaría.
Otros gobiernos u organizaciones pueden reutilizar o adaptar esta herramienta para mejorar el flujo de la gestión de las preguntas y respuestas que reciben diversos despachos y mejorar la comunicación con la sociedad civil.
Puedes ver el código fuente de la herramienta aquí:
