Acelera el descubrimiento con Gemini for Research
Los modelos de Gemini se pueden usar para avanzar en la investigación fundamental en todas las disciplinas. Estas son algunas formas en las que puedes explorar Gemini para tu investigación:
- Ajuste: Puedes ajustar los modelos de Gemini para una variedad de modalidades y avanzar en tu investigación. Obtén más información.
- Analiza y controla los resultados del modelo: Para realizar un análisis más detallado, puedes examinar una respuesta candidata generada por el modelo con herramientas como
Logprobs
yCitationMetadata
. También puedes configurar opciones para la generación y los resultados del modelo, comoresponseSchema
,topP
ytopK
. Obtén más información. - Entradas multimodales: Gemini puede procesar imágenes, audio y videos, lo que permite una gran cantidad de emocionantes direcciones de investigación. Obtén más información.
- Capacidades de contexto extenso: Gemini 1.5 Flash incluye una ventana de contexto de 1 millón de tokens, y Gemini 1.5 Pro, una ventana de contexto de 2 millones de tokens. Obtén más información.
- Crece con Google: Accede rápidamente a los modelos de Gemini a través de la API y Google AI Studio para casos de uso de producción. Si buscas una plataforma basada en Google Cloud, Vertex AI puede proporcionar infraestructura de asistencia adicional.
Para respaldar la investigación académica y promover la investigación de vanguardia, Google proporciona acceso a créditos de la API de Gemini para científicos e investigadores académicos a través del Programa Académico de Gemini.
Comienza a usar Gemini
La API de Gemini y Google AI Studio te ayudan a comenzar a trabajar con los modelos más recientes de Google y a convertir tus ideas en aplicaciones que se pueden escalar.
Python
from google import genai client = genai.Client() response = client.models.generate_content( model="gemini-2.0-flash", contents="How large is the universe?", ) print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({}); async function main() { const response = await ai.models.generateContent({ model: "gemini-2.0-flash", contents: "How large is the universe?", }); console.log(response.text); } await main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent" \ -H "x-goog-api-key: $GEMINI_API_KEY" \ -H 'Content-Type: application/json' \ -X POST \ -d '{ "contents": [{ "parts":[{"text": "How large is the universe?"}] }] }'
Académicos destacados
"Nuestra investigación analiza Gemini como un modelo de lenguaje visual (VLM) y sus comportamientos basados en agentes en diversos entornos desde perspectivas de solidez y seguridad. Hasta ahora, evaluamos la solidez de Gemini ante distracciones, como ventanas emergentes, cuando los agentes de VLM realizan tareas en la computadora, y aprovechamos Gemini para analizar la interacción social, los eventos temporales y los factores de riesgo en función de la entrada de video".
"Gemini Pro y Flash, con su larga ventana de contexto, nos han ayudado en OK-Robot, nuestro proyecto de manipulación móvil de vocabulario abierto. Gemini permite realizar consultas y comandos complejos en lenguaje natural sobre la "memoria" del robot: en este caso, observaciones anteriores realizadas por el robot durante un largo período de operación. Mahi Shafiullah y yo también usamos Gemini para desglosar tareas en código que el robot puede ejecutar en el mundo real".
Programa académico de Gemini
Los investigadores académicos calificados (como profesores, personal y estudiantes de doctorado) de los países admitidos pueden solicitar créditos de la API de Gemini y límites de frecuencia más altos para proyectos de investigación. Esta compatibilidad permite un mayor rendimiento para los experimentos científicos y avanza la investigación.
Nos interesan especialmente las áreas de investigación que se mencionan en la siguiente sección, pero aceptamos solicitudes de diversas disciplinas científicas:
Evaluaciones y comparativas: Métodos de evaluación respaldados por la comunidad que pueden proporcionar una señal de rendimiento sólida en áreas como la facticidad, la seguridad, el seguimiento de instrucciones, el razonamiento y la planificación.
Acelerar el descubrimiento científico en beneficio de la humanidad: Aplicaciones potenciales de la IA en la investigación científica interdisciplinaria, incluidas áreas como las enfermedades raras y desatendidas, la biología experimental, la ciencia de los materiales y la sostenibilidad.
Incorporación e interacciones: Utilizar modelos de lenguaje grandes para investigar interacciones novedosas en los campos de la IA incorporada, las interacciones ambientales, la robótica y la interacción entre personas y computadoras
Capacidades emergentes: Exploramos nuevas capacidades de agentes necesarias para mejorar el razonamiento y la planificación, y cómo se pueden expandir las capacidades durante la inferencia (p.ej., con Gemini Flash).
Comprensión e interacción multimodales: Identificar brechas y oportunidades para los modelos de base multimodales para el análisis, el razonamiento y la planificación en una variedad de tareas
Elegibilidad: Solo pueden postularse personas físicas (miembros del cuerpo docente, investigadores o equivalentes) afiliadas a una institución académica o una organización de investigación académica válidas. Ten en cuenta que el acceso a la API y los créditos se otorgarán y quitarán a discreción de Google. Revisamos las solicitudes todos los meses.