Etiqueta: Gemini

  • Google lanza una herramienta de IA que genera musica mediante un texto o una imagen

    Google lanza una herramienta de IA que genera musica mediante un texto o una imagen

    Google anunció este miércoles que su inteligencia artificial Gemini ya puede generar pistas musicales de hasta 30 segundos, descritas como “realistas y musicalmente complejas”, a partir de una simple descripción escrita o incluso de una imagen como referencia.

    La nueva función, denominada Lyria 3, estará disponible dentro de la aplicación Gemini en varios idiomas —entre ellos español, inglés, alemán, francés, hindi, japonés, coreano y portugués— y también para creadores de contenido en YouTube Shorts. Según explicó Myriam Hamed Torres, gerente senior de producto de Google DeepMind, el sistema traduce en segundos una idea creativa en una pista musical completa.

    “Simplemente describe una idea o sube una foto, como: ‘un lento de R&B cómico sobre un calcetín que encuentra a su pareja’ y, en cuestión de segundos, Gemini lo traducirá en una pista pegadiza y de alta calidad”, señaló la ejecutiva en un comunicado oficial. Además de la música, la herramienta puede generar carátulas personalizadas basadas en la letra y el estilo seleccionado.

    Google detalló que todas las pistas creadas en la aplicación incluyen SynthID, una marca de agua digital imperceptible que identifica el contenido generado por inteligencia artificial. La compañía subrayó que Lyria 3 busca fomentar la creatividad original y no replicar voces o estilos específicos de artistas existentes.

    “Si tu indicación nombra a un artista específico, Gemini lo tomará como una amplia inspiración creativa y creará una pista que comparta un estilo o estado de ánimo similar”, indicó Hamed Torres.

    El anuncio se produce en un contexto de debate sobre los derechos de autor y el uso de IA en la industria musical. En 2024, más de 200 artistas, entre ellos Billie Eilish, Pearl Jam y Katy Perry, solicitaron a las empresas tecnológicas frenar el uso de inteligencia artificial que pudiera “infringir y devaluar los derechos de los artistas humanos”.

    Google no es la única compañía que ofrece este tipo de servicios. Plataformas como Suno y Udio también permiten crear canciones en distintos estilos y lenguas, ampliando la competencia en el mercado de generación musical con inteligencia artificial.

  • Google lanza Project Genie, su prototipo de IA para generar mundos interactivos

    Google lanza Project Genie, su prototipo de IA para generar mundos interactivos

    Google lanzó oficialmente Project Genie, un prototipo que permite a los usuarios generar mundos interactivos mediante inteligencia artificial, utilizando una combinación de tecnologías desarrolladas por DeepMind: Genie 3, Nano Banana y Gemini.

    En agosto, la compañía presentó Genie 3, un modelo de IA que permite crear entornos dinámicos en tiempo real con resolución de 720p. A diferencia de su versión anterior, que solo generaba imágenes estáticas en 3D, Genie 3 ofrece experiencias más realistas y prolongadas.

    Ahora, Google permite que el público experimente directamente estas funciones a través de Project Genie, tras haber limitado su uso inicial únicamente a desarrolladores. El prototipo integra capacidades de imagen con Nano Banana y asistencia mediante Gemini, y busca ofrecer experiencias inmersivas que respondan a las indicaciones de los usuarios.

    Shlomi Frutcher, director de Investigación en DeepMind, destacó en una entrevista con TechCrunch que resulta “emocionante estar en un momento donde más personas pueden acceder y dar su opinión”.

    Project Genie ofrece tres funcionalidades principales: boceto, exploración y combinación de mundos. Con Nano Banana Pro, los usuarios pueden diseñar un borrador del mundo según sus instrucciones, definiendo el entorno, personajes y métodos de exploración. Después, pueden recorrer estos mundos en tiempo real, ya que el sistema genera los escenarios dinámicamente según sus acciones. También tienen la opción de reeditar y mezclar mundos previamente creados.

    Por ahora, Google habilitó el acceso a Project Genie solo para suscriptores del plan Google AI Ultra en Estados Unidos. La herramienta permite generar y explorar los mundos durante un máximo de 60 segundos por sesión. “Limitamos el uso a 60 segundos porque queremos que más personas puedan acceder”, explicó Frutcher, quien añadió que cada sesión funciona con un chip dedicado exclusivamente al usuario.

    Google advirtió que, al tratarse de un prototipo, los mundos generados podrían no parecer del todo realistas ni cumplir con exactitud todas las instrucciones del usuario. También reconoció que el control de personajes podría fallar y que podría presentarse cierta latencia durante la experiencia.

  • Google incorpora datos de Gmail y Fotos al Modo IA para búsquedas personalizadas

    Google incorpora datos de Gmail y Fotos al Modo IA para búsquedas personalizadas

    Google está integrando su nueva función de Inteligencia Personal en el Modo IA de su buscador, lo que permitirá ofrecer resultados personalizados a partir de la información almacenada en los correos electrónicos de Gmail y la galería de Google Fotos de cada usuario.

    Esta herramienta forma parte de los avances impulsados por Gemini, el modelo de inteligencia artificial más avanzado de la compañía, y busca hacer la experiencia de búsqueda más útil al combinar el conocimiento global con información específica y contextual de cada persona.

    La compañía explicó que esta función, ya presente en el asistente Gemini, ahora se aplicará también al buscador. Gracias a su capacidad de razonamiento entre múltiples fuentes, la IA puede interpretar y combinar datos provenientes de distintos formatos como textos, imágenes o videos para brindar respuestas más precisas y adaptadas.

    Entre los ejemplos mencionados, Google detalló que, si un usuario busca actividades para un próximo viaje, la IA podrá tener en cuenta reservas de hotel encontradas en Gmail y recuerdos similares almacenados en Google Fotos para sugerir actividades relacionadas.

    El objetivo es que los usuarios no tengan que repetir constantemente sus preferencias o planes, sino que el buscador anticipe sus necesidades con base en sus propios contenidos.

    Google recalcó que la Inteligencia Personal ha sido diseñada bajo principios de transparencia y control, y aseguró que los usuarios decidirán cuándo conectar Gmail y Fotos con el Modo IA. Además, aclaró que ni los correos ni las imágenes se usarán para entrenar los modelos de IA.

    Por ahora, esta experiencia se está implementando de forma limitada a través del programa Google Labs y está disponible únicamente para los suscriptores de los planes Google AI Pro y AI Ultra en Estados Unidos.

    Aunque Google advierte que podrían presentarse errores contextuales mientras la herramienta aprende, la compañía aseguró que continuará optimizando su funcionamiento a medida que más usuarios accedan a esta función.

  • Google prepara una nueva herramienta de generación de música a partir de texto para Gemini

    Google prepara una nueva herramienta de generación de música a partir de texto para Gemini

    Google está trabajando en una nueva herramienta de generación de música a partir de indicaciones de texto impulsada por la inteligencia artificial (IA) de Gemini, de manera que los usuarios puedan generar creaciones musicales de forma sencilla desde la aplicación.

    La tecnológica continúa desarrollando nuevas opciones para enriquecer la experiencia de los usuarios a la hora de utilizar su IA Gemini, en este caso, para cuestiones creativas como es el caso de generar música, al igual que ya ocurre con las imágenes y su modelo Nano Banana.

    En este sentido, Google está desarrollando una nueva herramienta que permitirá crear nueva música y canciones a partir de indicaciones de texto, pensada para agregarse a las opciones de la aplicación de Gemini, de cara a ofrecer una experiencia de interfaz sencilla para generar este contenido, acercándolo a cualquier persona.

    Así lo ha dado a conocer Android Authority tras llevar a cabo un análisis de APK de la versión 17.2.51.sa.arm64 de la aplicación de Gemini para Android, donde han encontrado partes del código de desarrollo en los que se hace referencia a una nueva herramienta de música ‘MUSIC_GENERATION_AS_TOOL’.

    Se ha de tener en cuenta que Gemini ya cuenta con modelos específicos para la creación de música, como es el caso de Lyria, que está disponible desde la API de Gemini y que permite a los desarrolladores crear aplicaciones en las que los usuarios puedan crear, dirigir y ejecutar música instrumental de forma interactiva en tiempo real.

    Sin embargo, se prevé que la nueva herramienta de creación música en la que está trabajando Google ponga estas capacidades a disposición de los usuarios de forma mucho más accesible, directamente desde la ‘app’ de Gemini.

    Con todo ello, por el momento se trata de una función en desarrollo, por lo que se desconoce cómo se implementará finalmente y las opciones que ofrecerá a los usuarios, así como cuándo llegará a la aplicación, en caso de lanzarse.

  • Gemini identifica los vídeos generados por la IA de Google

    Gemini identifica los vídeos generados por la IA de Google

    La aplicación de Gemini ya puede identificar si un vídeo ha sido generador por inteligencia artificial (IA), pero solo si en él ha intervenido la tecnología de Google.

    Ante un vídeo de cuestionable origen, los usuarios pueden usar la aplicación móvil de Gemini para pregutnar si está hecho con IA para que busque si cuenta con SynthID, una herramienta de Google que introduce una marca de agua directamente en los píxeles de cada cuadro de vídeo cuando en la creación interviene la IA.

    Esta marca es imperceptible para el ojo humano, pero no escapa al análisis de Gemini, que ahora puede detectarla tanto en las pistas de audio como en las visuales. En caso de encontrar coincidencias, informará de los segmentos que contienen elementos generados por la IA.

    Para ello, la ‘app’ de Gemini acepta la carga de archivos de vídeo de hasta 100 MB de peso y hasta 90 de duración, como informa en su blog oficial, y por el momento se limita a identificar la generación hecha con la IA de Google.

     

  • El 60 % de los profesionales y técnicos salvadoreños usa la inteligencia artificial con frecuencia

    El 60 % de los profesionales y técnicos salvadoreños usa la inteligencia artificial con frecuencia

    El 60 % de los profesionales y los técnicos salvadoreños utiliza la inteligencia artificial (IA) con frecuencia, reveló un estudio sobre la percepción de la IA en las empresas elaborado por la firma de relaciones públicas CCK Centroamérica y Datalex Latam.

    Los motores de inteligencia artificial no son un tema desconocido para los salvadoreños, pues un 96.6 % de profesionales y técnicos encuestados afirmó haber escuchado sobre ellos.

    La plataforma ChatGPT es la más utilizada, seguida de Gemini y Canva AI.

    Estas herramientas son empleadas principalmente para tareas creativas y de apoyo, ya que un 34 % dijo que recurre a la IA para crear anuncios y un 37 % para analizar comentarios de clientes.

    Diana Quirós, gerente de Investigación e Inteligencia de Datos de CCK, indicó que El Salvador tiene un alto nivel de adopción tecnológica, a la luz de los resultados del estudio, pero advirtió que “la confianza en las empresas dependerá de su capacidad de demostrar un uso responsable, ético y con propósito”.

     

    Responsabilidad en el uso de la IA

    A medida que aumenta el uso de los asistentes virtuales, también crece el riesgo de incurrir en plagio o de alterar contenidos que puedan enviar mensajes contrarios a los consumidores.

    Al respecto, el estudio encontró que solo un 39 % de los encuestados considera que las empresas son medianamente responsables del uso de la inteligencia artificial, mientras que un 23 % dijo no tener certeza de si se emplea de manera ética y transparente.

    Para Juan Esteban Durango, consultor de Datalex Latam, las empresas deben desarrollar marcos de gobernanza para regular el uso de la inteligencia artificial en sus actividades cotidianas, con el fin de incrementar la confianza y la transparencia que demandan los usuarios.

    Estas “políticas deben equilibrar la innovación con mecanismos claros de rendición de cuentas y sanciones ante el uso indebido de la tecnología”.

    El estudio también encontró que un 48 % de los salvadoreños considera que la IA mejora la imagen de las empresas, frente a un 14 % que cree que la deteriora.

    Los encuestados identificaron como principales riesgos el posible aumento del desempleo, la injusticia algorítmica y el uso excesivo de información personal.

    Además, un 61 % mostró su rechazo a utilizar la IA en tareas sensibles, como la evaluación de hojas de vida.

    Los resultados de este estudio se suman a una investigación de Qudox Growth Marketing Company, publicada en octubre pasado, que encontró que el 31 % de los salvadoreños utiliza la IA al menos una vez al día.

  • Apple pagará $1,000 millones al año a Google para renovar Siri

    Apple pagará $1,000 millones al año a Google para renovar Siri

    Apple actualizará su asistente de voz Siri en 2026 con un modelo de inteligencia artificial (IA) personalizado desarrollado por Google, como parte de un acuerdo valorado en $1,000 millones anuales, según reveló Bloomberg este miércoles.

    Ambas compañías tecnológicas afinan los últimos detalles de la alianza, que permitirá a Apple utilizar un modelo de lenguaje de gran tamaño (LLM) basado en la tecnología Gemini, con una capacidad de 1.2 billones de parámetros. Esta unidad de medida es clave para determinar la precisión, comprensión y fiabilidad del sistema de IA.

    Actualmente, el sistema Apple Intelligence que opera en la nube se basa en un modelo de solo 150,000 millones de parámetros. Con esta integración, Siri podrá ofrecer funciones avanzadas como resúmenes inteligentes y herramientas de planificación mediante lenguaje natural, superando ampliamente su versión actual.

    Aunque el modelo está siendo diseñado por Google, este se ejecutará en los servidores privados de Apple, lo que permitirá a la compañía garantizar la protección de datos de los usuarios sin depender de la infraestructura del gigante de las búsquedas.

    El acuerdo, que representa una inversión estratégica temporal para Apple, forma parte de los planes de transición hacia un modelo propio de inteligencia artificial. La empresa espera que esta colaboración con Google funcione como una solución provisional mientras su equipo trabaja en el desarrollo de su propio sistema.

    El nuevo Siri rediseñado se lanzará en la primavera de 2026 y llegará con mayor capacidad para interactuar con aplicaciones y dispositivos gracias a la integración de Apple Intents, lo que permitirá al usuario controlar todo el sistema solo con comandos de voz.

  • Google Maps integra navegación manos libres con IA Gemini

    Google Maps integra navegación manos libres con IA Gemini

    Google comenzó a implementar una nueva experiencia de navegación en Google Maps potenciada por Gemini, su asistente de inteligencia artificial, que transforma la conducción con una interfaz completamente conversacional y manos libres, ya disponible en Estados Unidos.

    La herramienta, que será compatible con Android, iOS y posteriormente Android Auto, permitirá al usuario interactuar de forma natural mientras conduce. La función permite hacer consultas como buscar un restaurante con opciones veganas en la ruta, ubicar cargadores para vehículos eléctricos o conocer los platos más populares en el destino.

    Esta actualización convierte al asistente en un auténtico copiloto virtual, ya que puede gestionar múltiples solicitudes simultáneamente, sin que el conductor pierda atención en el camino, según detalló Google en su blog oficial.

    Precisión, puntos de referencia y tráfico en tiempo real

    La inteligencia artificial también mejora las indicaciones de ruta al incorporar puntos de referencia fácilmente reconocibles. En lugar de las clásicas órdenes genéricas, Gemini podrá indicar: “Gire a la derecha después del restaurante Thai Siam”, y ese mismo punto de referencia se visualizará en el mapa.

    Además, el sistema permite reportar incidencias de tráfico en tiempo real y emite alertas proactivas incluso si el usuario no se encuentra en plena navegación, lo que representa un avance significativo en seguridad vial.

    Tecnología Lens para reconocimiento visual y preguntas avanzadas

    La nueva experiencia se complementa con Lens, el sistema de visión inteligente de Google, que identifica lugares, tiendas y monumentos. A través de Gemini, el usuario podrá profundizar en la información de estos sitios mediante preguntas como: “¿Cuál es el pato mejor valorado de este restaurante?” o “¿Qué tipo de ambiente hay en ese bar?”.

    Google confirmó que estas capacidades estarán disponibles en Estados Unidos a finales de este mes tanto para Android como para iOS.

  • Siri se actualizará con un modelo personalizado de Google pero mantendrá la interfaz de Apple

    Siri se actualizará con un modelo personalizado de Google pero mantendrá la interfaz de Apple

    El asistente de voz Siri, de Apple, incorporará en su próxima actualización un modelo de inteligencia artificial desarrollado por Google, diseñado específicamente para la compañía de Cupertino, aunque mantendrá intacta su interfaz gráfica, según informó este viernes el medio especializado Bloomberg.

    Apple habría evaluado otras opciones tecnológicas, incluyendo las ofrecidas por OpenAI y Anthropic, pero finalmente firmó un acuerdo con Google para utilizar una versión adaptada de su sistema Gemini, que ofrecerá nuevas funciones avanzadas en Siri.

    De acuerdo con el periodista Mark Gurman, autor del boletín Power On, el nuevo modelo se ejecutará en servidores de nube privada controlados por Apple. Esto significa que, aunque la tecnología de fondo sea de Google, no se integrarán los servicios propios de Gemini ni se trasladarán funcionalidades de Android al ecosistema de Apple.

    Siri mantendrá su apariencia clásica y será el único canal visible para el usuario, pero operará con una capacidad de procesamiento más potente y eficiente, impulsada por el modelo de IA.

    Se espera que esta versión rediseñada del asistente llegue en la primavera de 2026, con importantes mejoras en comprensión del lenguaje natural y la capacidad de integrarse con aplicaciones del sistema. Este avance vendrá acompañado del sistema Apple Intents, una tecnología que permitirá a Siri ejecutar tareas complejas a través de comandos de voz, ofreciendo un control más fluido del dispositivo.

  • Google Earth integrará IA de Gemini para prevenir desastres climáticos

    Google Earth integrará IA de Gemini para prevenir desastres climáticos

    Google anunció que su plataforma geoespacial Earth ahora incorpora capacidades de razonamiento impulsadas por Gemini, su inteligencia artificial, con el objetivo de mejorar la predicción y respuesta ante fenómenos climáticos extremos.

    Conocida como Google Earth AI, esta herramienta reúne modelos y bases de datos geoespaciales que permiten anticipar con mayor precisión desastres naturales como inundaciones, incendios forestales o tormentas, al combinar décadas de modelado cartográfico, imágenes satelitales y mapas poblacionales.

    Gracias al razonamiento de Gemini, el sistema puede procesar información compleja y responder preguntas clave, como qué comunidades se encuentran en mayor riesgo o qué infraestructura puede verse afectada por eventos meteorológicos severos.

    Por ejemplo, la IA es capaz de detectar ríos que han comenzado a secarse, lo cual representa un riesgo de tormentas de polvo para comunidades cercanas. Esta capacidad predictiva busca dar a las autoridades más tiempo para implementar acciones preventivas.

    La función de razonamiento se encuentra actualmente en fase experimental y estará disponible en las próximas semanas para usuarios profesionales de Google Earth en Estados Unidos.

    Además, Google informó que mediante Google Cloud, empresas podrán integrar sus propios datos con los modelos de Earth AI para enfrentar desafíos como el monitoreo ambiental o la gestión de emergencias.