Un nuevo conjunto de algoritmos de Google Brain ahora puede diseñar chips de computadora, aquellos específicamente diseñados para ejecutar software de inteligencia artificial, que superan ampliamente a los diseñados por expertos humanos. Y el sistema funciona en solo unas pocas horas, reduciendo drásticamente el proceso de semanas o meses que normalmente atasca la innovación digital.
En el corazón de estos diseñadores de chips robóticos se encuentra un tipo de aprendizaje automático llamado aprendizaje por refuerzo profundo. Esta familia de algoritmos, basada libremente en el funcionamiento del cerebro humano, ha triunfado sobre sus inspiraciones neuronales biológicas en juegos como Chess, Go y casi todo el catálogo de Atari .
Pero el juego era solo el entrenamiento de jardín de infantes de estos agentes de inteligencia artificial. Más recientemente, han crecido para abordar nuevos medicamentos para Covid-19, resolver uno de los mayores desafíos de la biología y revelar secretos del cerebro humano.
En el nuevo estudio, al crear el hardware que le permite funcionar de manera más eficiente, el aprendizaje por refuerzo profundo está flexionando sus músculos en el mundo real una vez más. El equipo adoptó inteligentemente elementos del juego en el desafío del diseño de chips , lo que resultó en concepciones que eran completamente "extrañas y ajenas" a los diseñadores humanos, pero que, sin embargo, funcionaron a la perfección.
No es solo teoría. Varios de los elementos de diseño del chip de la IA se incorporaron a la unidad de procesamiento tensorial (TPU) de Google, el chip acelerador de IA de la compañía, que fue diseñado para ayudar a que los algoritmos de IA se ejecuten de manera más rápida y eficiente.
“Esa fue nuestra visión con este trabajo”, dijo la autora del estudio Anna Goldie. "Ahora que el aprendizaje automático se ha vuelto tan capaz, eso es todo gracias a los avances en hardware y sistemas, ¿podemos usar la IA para diseñar mejores sistemas para ejecutar los algoritmos de IA del futuro?"
La ciencia y el arte del diseño de chips
Por lo general, no pienso en los microchips de mi teléfono, computadora portátil y un trillón de otros dispositivos repartidos por toda mi casa. Pero son la piedra angular, el “cerebro” de hardware, que controla estos amados dispositivos.
A menudo, del tamaño de una uña, los microchips son proezas de ingeniería exquisitas que incluyen decenas de millones de componentes para optimizar los cálculos. En términos cotidianos, un chip mal diseñado significa tiempos de carga lentos y la rueda giratoria de la muerte, algo que nadie quiere.
El meollo del diseño de chips es un proceso llamado "plano", dijo el Dr. Andrew Kahng, de la Universidad de California en San Diego, que no participó en este estudio. Similar a organizar sus muebles después de mudarse a un nuevo espacio, la planificación del piso de chips implica cambiar la ubicación de diferentes componentes de memoria y lógica en un chip para optimizar la velocidad de procesamiento y la eficiencia energética.
Es una tarea terriblemente difícil. Cada chip contiene millones de puertas lógicas, que se utilizan para la computación. Dispersos junto a estos hay miles de bloques de memoria, llamados macrobloques, que guardan datos. Estos dos componentes principales se interconectan a través de decenas de millas de cableado para que el chip funcione de la manera más óptima posible, en términos de velocidad, generación de calor y consumo de energía.
“Dada esta asombrosa complejidad, el proceso de diseño de chips en sí mismo es otro milagro, en el que los esfuerzos de los ingenieros, con la ayuda de herramientas de software especializadas, mantienen la complejidad bajo control”, explicó Kahng. A menudo, la planificación de la planta lleva semanas o incluso meses de minucioso ensayo y error por parte de expertos humanos.
Sin embargo, incluso con seis décadas de estudio, el proceso sigue siendo una mezcla de ciencia y arte. “Hasta ahora, la tarea de planificación del piso, en particular, ha desafiado todos los intentos de automatización”, dijo Kahng. Una estimación muestra que el número de configuraciones diferentes solo para la colocación de macrobloques de "memoria" es de aproximadamente 10 2.500 , magnitudes mayores que el número de estrellas en el universo.
Juego Play to the Rescue
Dada esta complejidad, parece una locura intentar automatizar el proceso. Pero Google Brain hizo precisamente eso, con un giro inteligente. Si piensa en macrobloques y otros componentes como piezas de ajedrez, entonces el diseño de fichas se convierte en una especie de juego, similar a los que antes dominaba el aprendizaje por refuerzo profundo. La tarea del agente es colocar secuencialmente macro bloques, uno por uno, en un chip de una manera optimizada para ganar el juego. Por supuesto, cualquier agente de IA ingenuo tendría dificultades. Como aprendizaje previo, el equipo capacitó a su agente con más de 10,000 planos de planta de chips. Con esa biblioteca de conocimientos, el agente podría explorar varias alternativas.
Durante el diseño, funcionó con un tipo de proceso de "prueba y error" que es similar a cómo aprendemos. En cualquier etapa del desarrollo del plano de planta, el agente de IA evalúa cómo le está yendo utilizando una estrategia aprendida y decide la forma más óptima de avanzar, es decir, dónde colocar el siguiente componente.
“Comienza con un lienzo en blanco y coloca cada componente del chip, uno a la vez, en el lienzo. Al final, obtiene una puntuación, una recompensa, basada en lo bien que lo hizo ”, explicó Goldie. Luego, la retroalimentación se usa para actualizar toda la red neuronal artificial, que forma la base del agente de IA, y prepararla para otra ronda.
La partitura está cuidadosamente diseñada para seguir las limitaciones del diseño del chip, que no siempre son las mismas. Cada ficha es su propio juego. Algunos, por ejemplo, si se implementan en un centro de datos, deberán optimizar el consumo de energía. Pero un chip para autos autónomos debería preocuparse más por la latencia para que pueda detectar rápidamente cualquier peligro potencial.
El Bio-Chip
Con este enfoque, el equipo no solo encontró una solución de diseño de un solo chip . Su agente de inteligencia artificial pudo adaptarse y generalizarse, necesitando solo seis horas adicionales de cálculo para identificar soluciones optimizadas para cualquier necesidad específica.
“Hacer que nuestro algoritmo se generalice en estos diferentes contextos fue un desafío mucho mayor que simplemente tener un algoritmo que funcionaría para un chip específico”, dijo Goldie.
Es una especie de modo de aprendizaje "de una sola vez", dijo Kahng, en el sentido de que puede producir planos de planta "superiores a los desarrollados por expertos humanos para chips existentes". Una línea principal parecía ser que el agente de IA estableció macrobloques en orden decreciente de tamaño. Pero lo que se destacó fue lo extraños que eran los diseños. Las ubicaciones fueron "redondeadas y orgánicas", una desviación masiva de los diseños de chips convencionales con bordes angulares y esquinas afiladas.
Los diseñadores humanos pensaron que “no había forma de que esto fuera a ser de alta calidad. Casi no querían evaluarlos ”, dijo Goldie.
Pero el equipo llevó el proyecto de la teoría a la práctica. En enero, Google integró algunos elementos diseñados por IA en sus procesadores de IA de próxima generación. Si bien los detalles se mantienen en secreto, las soluciones eran lo suficientemente intrigantes como para que se fabricaran físicamente millones de copias.
El equipo planea lanzar su código para que la comunidad en general optimice y comprenda aún más el cerebro de la máquina para el diseño de chips. Lo que parece mágico hoy en día podría proporcionar información sobre diseños de planos de planta aún mejores, extendiendo la Ley de Moore que se ralentiza gradualmente (o muere) para reforzar aún más nuestro hardware computacional. Incluso pequeñas mejoras en la velocidad o el consumo de energía en la informática podrían marcar una gran diferencia.
"Podemos ... esperar que la industria de los semiconductores redoble su interés en replicar el trabajo de los autores y buscar una serie de aplicaciones similares a lo largo del proceso de diseño de chips", dijo Kahng.
“El nivel de impacto que [una nueva generación de chips] puede tener en la huella de carbono del aprendizaje automático, dado que se implementa en todo tipo de centros de datos diferentes, es realmente valioso. Incluso un día antes, hace una gran diferencia ”, dijo Goldie.
Comments