– Cambridge Quantum lanza la primera biblioteca y kit de herramientas de procesamiento del lenguaje natural cuántico del mundo
Al convertir frases en circuitos cuánticos, ‘lambeq’ acelera el desarrollo de aplicaciones prácticas de QNLP a medida que los sistemas de computación cuántica escalan
CAMBRIDGE, Inglaterra, 13 de octubre de 2021 /PRNewswire/ — Cambridge Quantum (“CQ”) ha dado a conocer hoy el lanzamiento del primer juego de herramientas y biblioteca del mundo para el procesamiento del lenguaje natural cuántico (QNLP). El conjunto de herramientas se llama lambeq, y lleva el nombre del matemático y lingüista fallecido, Joachim Lambek.
lambeq es el primer conjunto de herramientas de software a nivel mundial destinado a QNLP que es capaz de convertir frases en un circuito cuántico. Se ha diseñado con el fin de acelerar el desarrollo de aplicaciones QNLP prácticas y del mundo real, como el diálogo automatizado, la minería de textos, la traducción de idiomas, la conversión de texto a voz, la generación de idiomas y la bioinformática.
lambeq se ha lanzado sobre una base totalmente de código abierto para el beneficio de la comunidad de computación cuántica del mundo y el ecosistema de rápido crecimiento de investigadores, desarrolladores y usuarios de computación cuántica. lambeq funciona a la perfección con TKETde CQ, la plataforma de desarrollo de software cuántico líder y de más rápido crecimiento en el mundo, que al mismo tiempo trabaja también con código abierto. Esto proporciona a los desarrolladores de QNLP acceso a la gama más amplia posible de computadoras cuánticas.
lambeq fue concebido, diseñado y desarrollado a través del equipo de investigación de computación cuántica de CQ con sede en Oxford, dirigido por el científico jefe Bob Coecke, con el científico senior Dimitrios Kartsaklis, Ph.D., como arquitecto jefe de la plataforma. lambeq, y QNLP más ampliamente, es el resultado de un proyecto de investigación que se remonta a más de una década atrás.
“Nuestro equipo ha estado involucrado en un trabajo fundamental que explora cómo las computadoras cuánticas pueden usarse para resolver algunos de los problemas más difíciles de tratar en inteligencia artificial”, explicó Coecke. “Este trabajo se ha basado en la realización de los avances en los que originalmente fui pionero, Steve Clark, ahora director de IA de CQ, y otros. La PNL se encuentra en el corazón de estas investigaciones. El lanzamiento de lambeq es el siguiente paso natural después de la publicación hace unos meses que proporcionó detalles de la primera implementación QNLP del mundo por parte de CQ en computadoras cuánticas reales, y nuestra divulgación inicial de los principios fundamentales en el mes de diciembre de 2019″.
“A través de varios documentos publicados durante el transcurso del año pasado”, añadió Coecke, “no solo proporcionamos detalles sobre cómo las computadoras cuánticas pueden mejorar la PNL, sino que también demostramos que QNLP es ‘nativo cuántico’, lo que significa que la estructura compositiva que gobierna el lenguaje es matemáticamente lo mismo que rige los sistemas cuánticos. Esto, en última instancia, alejará al mundo del paradigma actual de la IA que se basa en técnicas de fuerza bruta que son opacas y aproximadas”.
lambeq permite y automatiza el diseño y la implementación de experimentos de PNL del tipo de composición-distribución (DisCo) que los científicos de CQ han descrito previamente. Esto significa pasar de diagramas de sintaxis/gramática, que codifican la estructura de un texto, a redes de tensor (clásicas) o circuitos cuánticos implementados con TKET, listos para ser optimizados de cara a su uso en tareas de aprendizaje automático como la clasificación de texto. Lambeq cuenta con un diseño modular con el objetivo de que los usuarios puedan intercambiar componentes dentro y fuera del modelo y disponer de flexibilidad en lo que respecta al diseño de la arquitectura.
lambeq elimina las barreras de entrada para los profesionales e investigadores que se centran en la IA y las interacciones hombre-máquina, potencialmente una de las aplicaciones más importantes dentro de las tecnologías cuánticas. TKET ha ganado una base de usuarios mundial que ahora se mide en cientos de miles. lambeq tiene el potencial de convertirse en el conjunto de herramientas más importante para la comunidad de computación cuántica que busca involucrarse con las aplicaciones QNLP que se encuentran entre los mercados más importantes para la IA. Uno de los puntos claves que se ha hecho evidente recientemente es que QNLP también será aplicable al análisis de secuencias de símbolos que surgen tanto en el sector de la genómica como en el de la proteómica.
Merck Group, socio de lanzamiento y pionero en adoptar lambeq, ha publicado recientemente un artículo de investigación sobre QNLP como parte de un proyecto con el programa de innovación Quantum Entrepreneurship Laboratory de la Universidad Técnica de Múnich.
Thomas Ehmer, IT Healthcare Innovation Incubator de Merck y cofundador del Quantum Computing Interest Group, explicó: “El uso de las características únicas de la computación cuántica para avances fundamentales supone una parte importante de nuestra investigación en Merck. Nuestro proyecto recientemente revelado en QNLP con investigadores de TU Munich ha demostrado que las tareas de clasificación binaria para frases que utilizan técnicas QNLP pueden lograr resultados comparables incluso en esta etapa a los métodos clásicos existentes. Está claro que la infraestructura en torno a la computación cuántica deberá avanzar antes de que estas técnicas puedan emplearse comercialmente. De forma crítica, podemos ver cómo el enfoque empleado en QNLP abre el camino hacia una inteligencia artificial explicable y, por lo tanto, hacia una inteligencia más precisa que también es responsable, lo cual es fundamental en la medicina”.
“Existe una enorme cantidad de trabajo teórico interesante sobre QNLP, pero la teoría generalmente se encuentra a cierta distancia de la práctica”, comentó Kartsaklis. “Con lambeq, ayudamos a los investigadores a disponer de la oportunidad de adquirir experiencia práctica en aspectos experimentales de QNLP, que actualmente es un terreno completamente inexplorado. Se trata de un paso crucial para llegar al punto en el que las aplicaciones prácticas de PNL del mundo real en hardware cuántico se convierten en una realidad”.
lambeq se lanzó en forma de repositorio de Python convencional en GitHub y está disponible aquí: https://github.com/CQCL/lambeq. Hasta el momento, los circuitos cuánticos generados por lambeq se han ejecutado e implementado en computadoras cuánticas de IBM y en los dispositivos de la serie H de Honeywell Quantum Solutions.
El kit de herramientas se presenta mediante un informe técnico cargado en arxiv disponible aquí: https://arxiv.org/abs/2110.04236. Puede encontrar una publicación de blog más accesible en general aquí: https://medium.com/cambridge-quantum-computing/quantum-natural-language-processing-ii-6b6a44b319b2. Las consultas técnicas se pueden dirigir a lambeq-support@cambridgequantum.com.
En los últimos años, las aplicaciones basadas en PNL se han vuelto omnipresentes en todos los sectores de todo el mundo, desde el servicio al cliente y la tecnología del consumidor hasta la atención médica y la publicidad. Según los analistas de la industria, se espera que el mercado mundial de PNL tenga un valor de 127.260 millones de dólares para el año 2028 con una tasa compuesta anual de casi el 30%[1].
Acerca de Cambridge Quantum
Fundada en 2014 y respaldada por algunas de las principales empresas de computación cuántica del mundo, CQ es un líder mundial en software cuántico y algoritmos cuánticos, lo que permite a los clientes sacar el máximo provecho del hardware de computación cuántica en rápida evolución. CQ tiene oficinas en Europa, Estados Unidos y Japón. El 8 de junio de 2021, CQ anunció una fusión con Honeywell Quantum Solutions que se espera que se cierre en el cuarto trimestre de 2021.
Para más información, visite CQ en http://www.cambridgequantum.com y en LinkedIn. Acceda al código fuente de TKET, los enlaces de Python y las utilidades en GitHub.