Publicidad
Comparte esto en:

Ai Pin da Humane de cerca

Una oficina al lado alberga a los ingenieros de productos de Humane, mientras que el equipo de ingeniería eléctrica opera desde un tercer espacio al otro lado de la calle. La empresa también tiene una oficina en Nueva York, aunque la mayoría de sus 250 empleados se encuentran aquí en San Francisco.

Hoy en día, gran parte del espacio está ocupado por una serie de estaciones de demostración (con una estricta política de no filmar) donde diferentes Ai Pins están dispuestos en diversos estados de desnudez, exponiendo sus maquinaciones externas. Sin embargo, antes de participar, los cofundadores de Humane se paran frente a un pequeño grupo de sillas, flanqueando una pantalla plana que muestra la visión de la empresa.

Publicidad

La directora ejecutiva Bethany Bongiorno comparte una breve historia de la empresa, comenzando con cómo conoció al cofundador y presidente Imran Chaudhri en su primer día en Apple. Toda la historia de la empresa está ligada a su antiguo empleador. Fue allí donde persiguieron al CTO Patrick Gates, junto con otros 90 ex Applers.

Créditos de imagen: Brian calentador

A su vez, Chaudhri enmarca la historia de la empresa como una de curvas S: ciclos tecnológicos de 15 años que forman la base y, en última instancia, dan paso a lo que viene después. «La última era se ha estancado», dice en la sala, afirmando que el teléfono inteligente tiene «16 años», aunque esto también parece ser una indirecta a sus antiguos empleadores, cuyo primer iPhone llegó en 2007.

Publicidad

Enmarca el primer producto de Humane como «una nueva forma de pensar, una nueva sensación de oportunidad». Es un esfuerzo, añade, para «producir IA». La presentación personal es decididamente más fundamentada de lo que los videos anteriores te hacen creer. Es cierto que las declaraciones siguen siendo grandiosas y amplias, y contextualizan el dispositivo de solapa como el siguiente paso en un viaje informático que comenzó con mainframes del tamaño de una habitación, pero la conversación se vuelve un poco más pragmática cuando el dispositivo se presenta frente a nosotros.

El dispositivo del tamaño de una caja de cerillas tiene un procesador Snapdragon y 32 GB de almacenamiento local. La cámara es un sensor de 12 megapíxeles diseñado para un smartphone, pero integrado en el propio módulo Humane. Hay un acelerómetro y giroscopio y un sensor de profundidad y tiempo de vuelo. Al igual que los productos Apple, está diseñado en California y fabricado principalmente en Asia.

La mayor parte del exterior del dispositivo está monopolizada por un panel táctil que alberga la mayoría de los componentes integrados y una batería que debería durar cuatro o cinco horas con una carga. Encima, una especie de barra de cámara alberga los sensores superiores, junto con el sistema de proyección láser, con diferencia el aspecto visualmente más atractivo de toda la carcasa. La barra de la cámara está inclinada en ángulo hacia abajo. Humane dice que probó el pin en una variedad de tipos de cuerpo diferentes y se decidió por un diseño que se adapta a usuarios con cofres más grandes.

La compañía también me dijo que probó la proyección del láser con un espectro de diferentes tonos de piel para asegurarse de que fuera visible. Si bien son visualmente atractivas, las proyecciones se consideran una característica secundaria de lo que es esencialmente un producto que prioriza la voz. Sin embargo, si estás en un entorno demasiado ruidoso o silencioso para acomodar el pequeño altavoz orientado hacia arriba que se encuentra en la parte superior del dispositivo, toca el panel táctil y la cámara se pondrá a trabajar buscando una mano. Una vez localizado, comienza a sobresalir.

Créditos de imagen: Brian calentador

Chaudhri demostró la función durante una charla TED en mayo. Uno o dos minutos más tarde, llega una llamada preparada de Bongiorno, que el alfiler proyecta en forma de texto en la palma de su mano. Desde aquí, puede tocar la palma de su mano para aceptar o rechazar la llamada, y el sistema identifica el movimiento y actúa en consecuencia.

Sin embargo, los láseres pueden mostrar mucho más. El texto muestra los mensajes, por los que puedes desplazarte con un gesto de pellizco en la misma mano. Incluso pueden mostrar vistas previas rudimentarias de las imágenes que tomas, pero el láser verde no hace el mejor trabajo al resaltar las sutiles complejidades de una foto.

El AI Pin tiene un poco de peso, aunque esto se compensa un poco con el “refuerzo de batería” que viene en la caja, lo que aumenta la duración de la batería a aproximadamente nueve horas. El producto también viene con un estuche en forma de huevo que agrega otra carga completa al producto. Puede insertar el pasador, el refuerzo o ambos, y encajarán en su lugar magnéticamente. La carga se realiza a través de una serie de pines en la parte posterior del dispositivo. También en la caja hay una base de carga para uso doméstico.

Bongiorno confirmó informes anteriores sobre un lote inicial de 100.000 unidades. «Creo que, como ocurre con cada nueva puesta en marcha de hardware, queremos asegurarnos de planificar de forma conservadora para todos los escenarios», afirma. “Para nosotros, al principio, realmente se trataba de ver qué era lo más conservador, correcto y responsable en términos de demanda y permitirnos la opción si nuestra demanda supera los 100.000”.

Añade que, hasta ayer, más de 110.000 personas se habían inscrito para esperar, aunque esa cifra es más indicativa de curiosidad que de planes de compra reales, ya que no se requirió ningún depósito. La lista también es global, mientras que el dispositivo solo está disponible para pedidos anticipados en los EE. UU., donde saldrá a la venta “a principios del próximo año”. El grupo inicial en lista de espera tendrá “acceso prioritario” para adquirir el producto.

Créditos de imagen: Brian calentador

El corazón del dispositivo es la IA. Es uno de los primeros productos de hardware que aprovecha la actual ola de entusiasmo en torno a la IA generativa, pero ciertamente no será el último. El nombre de Sam Altman ha estado estrechamente vinculado a la startup desde el día de su anuncio. Pregunto hasta qué punto Altman y OpenAI participaron en la creación del producto.

«Sam lideró nuestra Serie A en 2020. Imran tenía muy claro que Sam era el objetivo de la Serie A y realmente quería que participara», dice Bongiorno. “Creo que había mucho respeto mutuo y entusiasmo por lo que todos creíamos que era el futuro, en términos de computadoras. Ha sido un increíble defensor y partidario de nosotros y contesta el teléfono cada vez que necesitamos consejo y orientación. Hemos estado trabajando con el equipo de OpenAI. Nuestro equipo de ingeniería colaboró ​​y trabajó en estrecha colaboración”.

Según Chaudhri, GPT es uno de los muchos LLM que aprovecha el sistema. También confirmó que GPT-4 estará entre las instancias que utilizará el sistema. Sin embargo, en última instancia, los sistemas de IA precisos que se aprovechan para cualquier tarea determinada son algo oscuros por diseño. Se accede a ellos caso por caso, según la determinación del PIN del curso de acción apropiado.

Esto también se aplica a las consultas basadas en web. El sistema rastrea una variedad de diferentes motores de búsqueda y recursos, como Wikipedia. Algunos serán socios de contenido oficiales, otros no. Hasta ahora, los socios reales son limitados. Están OpenAI y Microsoft, así como Tidal, que sirve como aplicación de música predeterminada del sistema. Un ejemplo dado durante una de nuestras demostraciones fue «tocar música producida por Prince», en lugar del más sencillo «tocar Prince».

“Parte de nuestra IA es patentada. Construimos nuestras propias IA y luego aprovechamos elementos como los modelos GPT y OpenAI”, afirma Bongiorno. “Podemos agregar LLM y muchos servicios de otras personas, y nuestro objetivo es ser la plataforma para todos y permitir el acceso a diversas experiencias y servicios de IA, por lo que el modelo de negocio está estructurado de una manera que nos permita hacerlo. Y creo que también pensaremos en diferentes modelos de ingresos que podamos agregar y diferentes flujos de ingresos en la plataforma”.

Créditos de imagen: Brian calentador

El objetivo es hacer que la experiencia sea perfecta, tanto en términos de lo que sucede en el backend con los LLM como de las búsquedas y actualizaciones web. El sistema está diseñado para impulsar actualizaciones continuamente y agregar nuevas funciones en segundo plano. También utiliza contexto adicional, incluidas preguntas realizadas recientemente y ubicación, mediante el uso de GPS integrado.

Las fotografías también son una gran pieza del rompecabezas. La cámara incorporada tiene un ángulo ultra gran angular con un campo de visión de 120 grados. No hay enfoque automático en juego; en cambio, es una distancia focal fija. Al menos a la luz de las oficinas de SF, las fotos parecían sólidas. Hay una buena cantidad de fotografía computacional que ocurre fuera de los dispositivos, incluido tener en cuenta si el pin está nivelado al tomar una foto y orientar la imagen final en consecuencia.

Aquí todavía parece que estamos en los primeros días, pero está claro que se ha invertido mucho cuidado (y dinero) en el producto. La demanda es quizás el mayor interrogante aquí. ¿Humane realmente ha encontrado una aplicación excelente? Para los fabricantes de relojes inteligentes, la salud siempre ha sido la respuesta. Pero el control de la salud juega aquí un papel mucho menor.

En realidad, el producto no entra en contacto directo con la piel del usuario, por lo que las métricas de salud que realmente es capaz de recopilar son limitadas, aparte de quizás servir como podómetro, aunque esa característica tampoco es compatible actualmente. La característica más importante relacionada con la salud en este momento es el conteo de calorías, que le indica específicamente cuántas calorías y otros datos nutricionales hay en el alimento que muestra a la cámara, utilizando una plataforma de identificación de alimentos de terceros anónima.

Créditos de imagen: Brian calentador

Publicidad

El precio ciertamente será un obstáculo para el dispositivo no probado: $699 es básicamente nada para los estándares de los teléfonos inteligentes, pero es mucho pedir para un producto de primera generación y un nuevo factor de forma. Los $24 adicionales al mes tampoco ayudan, aunque Bongiorno agrega: “Obtendrás un número de teléfono; obtienes llamadas, mensajes de texto y datos ilimitados; recibe tantas consultas de IA como desee además de todos nuestros servicios de IA. Hoy vemos cuánto entusiasmo hay en torno a ChatGPT, donde la gente ya está pagando para acceder a él”.

Sin embargo, si no paga ese mes, el producto es efectivamente un pisapapeles hasta que comience la suscripción.

Antes de que termine nuestra sesión, le pregunto a Chaudhri cómo llegó la empresa a la solapa, de todos los lugares, especialmente cuando las pantallas montadas en la cabeza se consideran estándar desde hace algún tiempo. Ciertamente, su antiguo empleador, Apple, está haciendo todo lo posible con su próximo Vision Pro.

«La informática contextual siempre se ha considerado algo que deberías llevar en la cara», afirma. “Hay muchos problemas con esto. Mucha gente usa gafas que usted usa por una razón muy precisa. Es para ayudarle a ver o proteger sus ojos. Esta es una decisión muy personal: la forma de su estructura, el peso de su estructura. Todo se transforma en algo tan único como tú. Si nos fijamos en el poder del contexto, y éste es el impedimento para lograr la computación contextual, debe haber otra manera. Entonces empezamos a mirar ¿cuál es la pieza que nos permite ser mucho más personales? Descubrimos que todos usamos ropa, entonces, ¿cómo podemos adornar un dispositivo que nos brinde contexto sobre nuestra ropa?


Comparte esto en:
Publicidad

Publicaciones Similares

Deja un comentario