


Explora. Visualiza. Modela. Una mejor perspectiva empieza con Stata.
Rápido. Preciso. Fácil de usar. Stata es un paquete de software completo e integrado que cubre todas sus necesidades de ciencia de datos: manipulación de datos, visualización, estadísticas e informes automatizados.
Novedades de Stata 19
Adquirir o actualizar Stata
Adquirir Stata para empresas, gobiernos, organizaciones sin fines de lucro, instituciones educativas o estudiantes.
OS | Mac con Windows 10 y Apple Silicon y macOS 10.13 o posterior para Mac con procesadores Intel |
---|---|
Processor | Apple Silicon, procesador Intel o AMD (Core i3 o superior) |
Memory | Stata/MP > 4GB, Stata/SE > 2GB, and Stata/BE 1GB |
Hard Drive | 4 GB |

Gestión de Datos

Stadísticas

Gráficos
¿Por qué Stata?
Rápido. Preciso. Fácil de usar. Stata es un paquete de software completo e integrado que cubre todas sus necesidades de ciencia de datos: manipulación de datos, visualización, estadísticas e informes automatizados.
|
|


Domine sus datos
Las funciones de gestión de datos de Stata le brindan control total.
|
|


Gráficos de calidad de publicación
Stata facilita la generación de gráficos con un estilo distintivo y con calidad de publicación.
Puedes apuntar y hacer clic para crear un gráfico personalizado. O puedes escribir scripts para producir cientos o miles de gráficos de forma reproducible.
Exporte gráficos a EPS o TIFF para publicación, a PNG o SVG para la web, o a PDF para visualización.
Con el Editor de gráficos integrado, puede hacer clic para cambiar cualquier aspecto de su gráfico o para agregar títulos, notas, líneas, flechas y texto.
Informes automatizados
Todas las herramientas que necesitas para automatizar el informe de tus resultados.
- Documento de Markdown dinámico
- Crear documentos de Word
- Crear documentos PDF
- Crear archivos de Excel
- Tablas personalizables
- Esquemas para gráficos
- Word, HTML, PDF, SVG, PNG


Investigación verdaderamente reproducible
Mucha gente habla de investigación reproducible. Stata se ha dedicado a ello durante más de 40 años.
Constantemente añadimos nuevas funciones; incluso hemos modificado radicalmente elementos del lenguaje. No importa. Stata es el único paquete estadístico con control de versiones integrado. Si escribiste un script para realizar un análisis en 1985, ese mismo script seguirá ejecutándose y produciendo los mismos resultados hoy. Cualquier conjunto de datos que creaste en 1985, podrás leerlo hoy. Y lo mismo ocurrirá en 2050. Stata podrá ejecutar cualquier cosa que hagas hoy.
Nos tomamos muy en serio la reproducibilidad.
PyStata - Integración de Python
Invoque Python de forma interactiva o incorpore Python en su código Stata.
Invocar Stata desde Python y llamar al código Stata desde entornos IPython.
Utilice Stata dentro de Jupyter Notebook.
Transfiera datos y resultados sin problemas entre Stata y Python.
Utilice los análisis de Stata desde Python.
Utilice cualquier paquete de Python dentro de Stata
- Matplotlib y seaborn para visualización
- Beautiful Soup and Scrapy para el web scraping
- NumPy y pandas para análisis numérico
- TensorFlow y scikit-learn para el aprendizaje automático
- Y mucho más


Documentación real
Cuando llega el momento de realizar sus análisis o comprender los métodos que está utilizando, Stata no lo deja abandonado a su suerte ni lo obliga a pedir libros para aprender cada detalle.
Cada una de nuestras funciones de gestión de datos está completamente explicada y documentada, y se muestra en la práctica con ejemplos reales. Cada estimador está completamente documentado e incluye varios ejemplos con datos reales, con explicaciones reales sobre cómo interpretar los resultados. Los ejemplos le proporcionan los datos para que pueda trabajar con Stata e incluso ampliar los análisis. Le ofrecemos una guía de inicio rápido para cada función, mostrando algunos de los usos más comunes. ¿Desea obtener más detalles? Nuestras secciones de Métodos y fórmulas proporcionan los detalles de lo que se calcula, y nuestras Referencias le indican aún más información.
Stata es un paquete grande y, por lo tanto, cuenta con mucha documentación: más de 19 000 páginas en 36 manuales. Pero no te preocupes, escribe "ayuda con mi tema" y Stata buscará en sus palabras clave, índices e incluso en paquetes aportados por la comunidad para ofrecerte toda la información que necesitas sobre tu tema. Todo está disponible directamente en Stata.
De confianza
No solo programamos métodos estadísticos, los validamos.
Los resultados que obtiene de un estimador de Stata se basan en comparaciones con otros estimadores, simulaciones de Monte Carlo de consistencia y cobertura, y exhaustivas pruebas realizadas por nuestros estadísticos. Todos los productos de Stata que entregamos han superado un paquete de certificación que incluye 7,2 millones de líneas de código de prueba que generan 6 millones de líneas de salida. Certificamos cada número y fragmento de texto de esos 5,8 millones de líneas de salida.
Confiable
Durante más de 40 años, StataCorp ha sido fiel a sus usuarios, expandiendo el software Stata con nuevos métodos estadísticos y lo último en generación de informes, visualización y manipulación de datos, así como en la interfaz de usuario. Gracias a nuestra larga trayectoria de lanzamientos, nos comprometemos a proporcionar continuamente un software estable y confiable a nuestra diversa comunidad de investigadores y profesionales.
Actualizado continuamente
Mantenerse actualizado con la versión más actualizada de Stata ahora es más fácil que nunca.
StataCorp desarrolla continuamente nuevas funciones para mejorar el software Stata, desde los métodos estadísticos más recientes hasta la mejor generación de informes, visualización de datos e interfaz de usuario. Con StataNow™, se lanzan nuevas funciones desde la versión actual hasta la siguiente versión principal. Estas funciones se priorizan en el ciclo de desarrollo para que estén disponibles en cuanto estén listas y los usuarios puedan aprovecharlas de inmediato.
Fácil de usar
Mantenerse actualizado con la versión más actualizada de Stata ahora es más fácil que nunca.
Se puede acceder a todas las funciones de Stata a través de menús, diálogos, paneles de control, un editor de datos, un administrador de variables, un editor de gráficos e incluso un generador de diagramas SEM. Puede navegar por cualquier análisis con solo apuntar y hacer clic.
Si no quieres escribir comandos ni scripts, no tienes que hacerlo.
Incluso mientras apunta y hace clic, puede registrar todos sus resultados e incluirlos posteriormente en informes. Incluso puede guardar los comandos generados por sus acciones y reproducir su análisis completo posteriormente.


Fácil de cultivar con
Los comandos de Stata para realizar tareas son intuitivos y fáciles de aprender. Mejor aún, todo lo aprendido sobre la ejecución de una tarea puede aplicarse a otras. Por ejemplo, simplemente añada `if gender=="female"` a cualquier comando para limitar el análisis a las mujeres de la muestra. Simplemente añada `vce(robust)` a cualquier estimador para obtener errores estándar y pruebas de hipótesis robustas a muchos supuestos comunes.
La consistencia es aún más profunda. Lo aprendido sobre los comandos de gestión de datos suele aplicarse a los comandos de estimación, y viceversa. También existe un conjunto completo de comandos de posestimación para realizar pruebas de hipótesis, formar combinaciones lineales y no lineales, hacer predicciones, generar contrastes e incluso realizar análisis marginales con gráficos de interacción. Estos comandos funcionan de la misma manera con prácticamente cualquier estimador.
La secuenciación de comandos para leer y depurar datos, realizar pruebas estadísticas y estimaciones, y finalmente informar los resultados, es fundamental para una investigación reproducible. Stata facilita el acceso a este proceso a todos los investigadores.
Fácil de automatizar
Todos tenemos tareas que realizamos constantemente: crear un tipo específico de variable, generar una tabla específica, realizar una secuencia de pasos estadísticos, calcular un RMSE, etc. Las posibilidades son infinitas. Stata cuenta con miles de procedimientos integrados, pero es posible que tenga tareas relativamente únicas o que desee realizar de una manera específica.
Si ha escrito un script para realizar su tarea en un conjunto de datos determinado, es fácil transformar ese script en algo que pueda usarse en todos sus conjuntos de datos, en cualquier conjunto de variables y en cualquier conjunto de observaciones.
Fácil de ampliar
Algunas de las cosas que automatizas pueden ser tan útiles que quieras compartirlas con tus colegas o incluso ponerlas a disposición de todos los usuarios de Stata. Es muy fácil. Con solo un poco de código, puedes convertir un script de automatización en un comando de Stata. Un comando que admite las funciones estándar de los comandos oficiales de Stata. Un comando que se puede usar de la misma manera que los comandos oficiales.


Programación avanzada
Stata también incluye un lenguaje de programación avanzado: Mata.
Mata tiene las estructuras, punteros y clases que esperas en tu lenguaje de programación y agrega soporte directo para la programación matricial.
Aunque no es necesario programar para usar Stata, es reconfortante saber que un lenguaje de programación rápido y completo es parte integral de Stata. Mata es tanto un entorno interactivo para manipular matrices como un entorno de desarrollo completo que puede producir código compilado y optimizado. Incluye funciones especiales para procesar datos de panel, realiza operaciones con matrices reales o complejas, ofrece soporte completo para programación orientada a objetos y está completamente integrado con todos los aspectos de Stata. Stata también cuenta con una completa integración con Python, lo que permite aprovechar toda la potencia de Python directamente desde el código de Stata.
Stata también tiene PyStata, que proporciona una integración completa con Python, lo que le permite aprovechar todo el poder de Python directamente desde su código Stata y aprovechar todo el poder de Stata desde su código Python.
Stata incluso te permite incorporar complementos de C, C++ y Java en tus programas mediante una API nativa para cada lenguaje. ¡Incluso puedes incrustar código Java directamente en tu código de Stata!


Funciones aportadas por la comunidad
Stata es tan programable que los desarrolladores y usuarios agregan nuevas funciones todos los días para responder a las crecientes demandas de los investigadores actuales.
Con las capacidades de Internet de Stata, se pueden instalar nuevas funciones y actualizaciones oficiales a través de Internet con un solo clic.
Soporte técnico de clase mundial
Todos los usuarios registrados de la versión actual de Stata (Stata 19) pueden acceder a soporte técnico gratuito. Si aún no ha registrado su copia de Stata, complete el formulario de registro en línea.
Contamos con un equipo dedicado de programadores y estadísticos expertos en Stata para responder a sus preguntas técnicas. Desde soluciones complejas de gestión de datos hasta cómo lograr que su gráfico tenga la apariencia perfecta, y desde la explicación de un error estándar robusto hasta la especificación de su modelo multinivel, tenemos las respuestas.
Compatible con varias plataformas
Stata funciona en ordenadores Windows, Mac y Linux/Unix; sin embargo, nuestras licencias no son específicas de ninguna plataforma. Esto significa que si tiene una portátil Mac y una de escritorio Windows, no necesita dos licencias independientes para ejecutar Stata. Puede instalar su licencia de Stata en cualquiera de las plataformas compatibles. Los conjuntos de datos, programas y otros datos de Stata se pueden compartir entre plataformas sin necesidad de traducción. También puede importar conjuntos de datos de otros paquetes estadísticos, hojas de cálculo y bases de datos de forma rápida y sencilla.
Ampliamente utilizado
Utilizado por investigadores durante más de 40 años, Stata proporciona todo lo que necesita para la ciencia de datos: manipulación de datos, visualización, estadísticas e informes automatizados.
Seleccione su disciplina y vea cómo Stata puede trabajar para usted.
Novedades de Stata 19
Lleve su investigación más lejos con las nuevas funciones de Stata 19.
Stata 19 tiene algo para todos. A continuación, enumeramos los aspectos más destacados de esta versión. Stata 19 es único porque la mayoría de las nuevas funciones pueden ser utilizadas por investigadores de todas las disciplinas.


Aprendizaje automático mediante H2O: árboles de decisión de conjunto
Con la nueva suite h2oml, utilice el aprendizaje automático a través de H2O para extraer información valiosa de los datos cuando los modelos estadísticos tradicionales resultan insuficientes. Los métodos de aprendizaje automático se utilizan a menudo para resolver problemas de investigación y empresariales centrados en la predicción.


Efectos del tratamiento promedio condicional (CATE)
Con el nuevo comando cate, puede ir más allá de estimar un efecto general del tratamiento para estimar efectos individualizados o específicos del grupo que aborden este tipo de preguntas de investigación.


Efectos fijos de alta dimensión (HDFE)
Absorba no solo una sino múltiples variables categóricas de alta dimensión en sus modelos lineales y lineales de efectos fijos con la opción absorb() de los comandos areg y xtreg.


Selección de variables bayesianas para regresión lineal
Con el nuevo comando bayesselect, puede realizar la selección bayesiana de variables para la regresión lineal. Este enfoque ofrece una interpretación intuitiva y una inferencia estable, considerando la incertidumbre del modelo.


Modelos marginales de PH de Cox para datos de eventos múltiples censurados por intervalos
Utilice el nuevo comando stmgintcox para analizar datos de eventos múltiples censurados por intervalo.


Metaanálisis de correlaciones
La suite meta ahora admite el metanálisis (MA) de un coeficiente de correlación. Se admiten todas las funciones estándar de metanálisis, como los diagramas de bosque y el análisis de subgrupos.


Modelo de efectos aleatorios correlacionados (CRE)
¿Necesita estimaciones de coeficientes de covariables invariantes en el tiempo en su modelo de datos de panel? Con xtreg, cre , ahora puede ajustar un modelo de efectos aleatorios correlacionados.


Modelo autorregresivo vectorial (VAR) de datos de panel
Con el nuevo comando xtvar, ahora puede ajustar un modelo vectorial autorregresivo (VAR) de datos de panel para analizar las trayectorias de variables relacionadas cuando observa múltiples unidades o paneles a lo largo del tiempo.


Bootstrap bayesiano y pesos de réplica
Puede usar el nuevo prefijo bayesboot para realizar un bootstrap bayesiano de las estadísticas generadas por comandos oficiales y aportados por la comunidad. El bootstrap bayesiano puede incorporar información previa para obtener estimaciones de parámetros más precisas.


Modelos lineales y probit de función de control
Ajuste modelos lineales y probit de función de control con los nuevos comandos cfregress y cfprobit. Los modelos de función de control ofrecen un enfoque más flexible a los métodos tradicionales de variables instrumentales (VI) al incluir variables endógenas.


Regresión cuantil bayesiana mediante verosimilitud asimétrica de Laplace
El nuevo comando bayes:qreg se ajusta a la regresión cuantil bayesiana. El marco bayesiano proporciona distribuciones posteriores completas para los coeficientes de la regresión cuantil, lo que permite una inferencia exhaustiva.


Inferencia robusta a instrumentos débiles
Utilice el nuevo comando estat weakrobust para realizar inferencias confiables en regresores endógenos.


Modelos autorregresivos vectoriales estructurales (SVAR) mediante variables instrumentales
Con el nuevo comando ivsvar, puede utilizar instrumentos en lugar de restricciones de corto plazo para estimar efectos causales dinámicos.


IRF de proyección local de variables instrumentales
Con el nuevo comando ivlpirf, puede tener en cuenta la endogeneidad al utilizar proyecciones locales para estimar efectos causales dinámicos.


Prueba de especificación de Mundlak
Utilice el nuevo comando de postestimación estat mundlak después de xtreg para elegir entre modelos de efectos aleatorios (RE), efectos fijos (FE) o efectos aleatorios correlacionados (CRE) incluso con errores estándar robustos a grupos, bootstrap o jackknife.


Estadísticas de comparación de modelos de clases latentes
Con el nuevo comando lcstats, puede utilizar estadísticas como la entropía y una variedad de criterios de información para ayudarlo a determinar la cantidad adecuada de clases.


Editor de archivos Do: autocompletado, plantillas y más
El editor de archivos Do tiene las siguientes novedades: Autocompletado de nombres de variables, macros y resultados almacenados; Mejoras en el plegado de código; Marcadores temporales y permanentes; Plantillas, pestañas y panel de navegación.


Gráficos: CI de gráficos de barras, mapas de calor y más
Nuevas características gráficas: Mapas de calor (dos vías); Gráfico de rango y puntos con picos limitados (dos vías); Gráfico de rango y puntos con picos (dos vías); Etiquetado mejorado, CI y control de agrupaciones para gráficos de barras, gráficos de puntos y diagramas de caja; Colores por variable para más gráficos.


Tablas: tabulaciones más sencillas, exportación y más
Cree y personalice fácilmente tablas con títulos, notas y opciones de exportación. El comando "tabla" es una herramienta flexible para crear tabulaciones, tablas de estadísticas de resumen, tablas de resultados de regresión y más.


Stata en francés
Los menús, diálogos y demás elementos de Stata ahora se pueden mostrar en francés. Si el idioma de su ordenador es francés (fr), Stata usará automáticamente la configuración en francés.
Presentamos StataNow™
Nuevas funciones lanzadas al ritmo de Stata. Con StataNow, siempre tendrás las últimas funciones.
StataNow es una versión de lanzamiento continuo de Stata, que ofrece nuevas funciones tan pronto como están listas y garantiza que los usuarios siempre tengan acceso a la versión más reciente de Stata.
Directamente del desarrollo a ti. Con StataNow, siempre tienes acceso a las últimas funciones.
¿Qué es StataNow?
Ante todo, StataNow es Stata. Es una versión de lanzamiento continuo de Stata que ofrece nuevas funciones en cuanto están disponibles. StataNow es el resultado de nuestro esfuerzo continuo por ofrecer el mejor Stata (el Stata más actualizado) a nuestros usuarios. Antes de StataNow, la mayoría de las nuevas funciones solo estaban disponibles con una versión principal, como Stata 17, Stata 18, etc. StataNow proporciona acceso a las nuevas funciones antes. Por ejemplo, StataNow contiene funciones que también formarán parte de una futura versión principal, Stata 20.
¿Cómo puedo obtener StataNow?
Todos los titulares de licencias anuales tienen acceso a StataNow, independientemente de si tienen una licencia anual o multianual, o si su institución tiene una licencia de sitio. Puede acceder a las últimas funciones de StataNow simplemente escribiendo actualizar todo en la ventana de comandos o solicitando a su administrador del sistema que actualice su Stata. Los usuarios de Stata 19 podrían tener que escribir actualizar todo dos veces. La primera actualización le proporcionará un Stata que sabe cómo actualizarse automáticamente a StataNow. La segunda actualización será StataNow. Luego, escriba ayuda qué es nuevo para ver la lista de todas las funciones.
Los nuevos usuarios pueden obtener StataNow en línea, comprando cualquier Stata anual. licencia
Si tiene mantenimiento para su licencia, contáctenos para obtener nueva información de descarga y licencia para StataNow.
Si tiene una licencia perpetua sin mantenimiento o su mantenimiento o licencia ha expirado, contáctenos para conocer sus opciones.
¿Cómo sé si ya tengo StataNow?
Al iniciar Stata, verá StataNowen la pantalla de inicio. También puede escribir about y verá StataNow en la primera línea.
Novedades de StataNow 19
Análisis de potencia para regresión logística | Lanzado en mayo de 2025
Diseñar un estudio eficaz requiere equilibrar la potencia estadística, el tamaño de la muestra y el costo. El nuevo comando power logistic
de Stata le ayuda a determinar el tamaño de muestra óptimo para modelos de regresión logística sin desperdiciar tiempo ni recursos.
El comando power logistic
de Stata calcula el tamaño de la muestra, la potencia o el tamaño del efecto para la prueba de un coeficiente de interés en un modelo de regresión logística. Como con todos los demás métodos power
, power logistic
le permite especificar múltiples valores de parámetros y producir automáticamente resultados tabulares y gráficos.
Efectos locales promedio del tratamiento (LATE) | Lanzado en agosto de 2025
StataNow™ presenta lateffects
, una nueva función para estimar los efectos locales promedio del tratamiento (LATE), es decir, los efectos causales para la subpoblación que cumple con la asignación del tratamiento.
Cuando las diferencias no observables entre las unidades tratadas y no tratadas hacen imposible identificar efectos para toda la población, lateffects
aprovecha un instrumento —como la asignación aleatoria en experimentos o una variable exógena en estudios observacionales— para aislar el efecto para los cumplidores.
A diferencia de los mínimos cuadrados en dos etapas estándar, que pueden fallar cuando se incluyen covariables, lateffects
estima con precisión el LATE tanto con como sin covariables, proporcionando una herramienta sólida para la inferencia causal en presencia de incumplimiento.
Adiciones de VCE para modelos lineales | Lanzado en agosto de 2025
StataNow™ amplía las capacidades de la regresión lineal con más opciones de VCE, brindándole errores estándar e intervalos de confianza que siguen siendo confiables en una gama más amplia de escenarios.
Las nuevas funciones incluyen errores estándar consistentes frente a heterocedasticidad y autocorrelación (HAC) para regress
y areg
, errores estándar de Driscoll–Kraay para xtreg, fe
, y una corrección de sesgo mejorada con errores estándar HC2 y HC3 (incluida la corrección de Hansen de 2025) en múltiples comandos.
ivregress
ahora admite múltiples conglomerados no anidados, y xtgls
puede modelar correlación arbitraria dentro de los paneles con la opción corr(unstructured)
. Estas mejoras hacen que la inferencia robusta sea más fácil y flexible que nunca.
Cinta de historial de cambios en el Editor de Do-files | Lanzado en agosto de 2025
El Editor de Do-files ahora puede mostrar los tipos de cambios realizados en un documento como marcadores de colores en la cinta de historial de cambios, ubicada en el margen. Dos colores de marcador identifican las líneas que han sido modificadas y las que se han revertido al original. Para especificar si desea que la cinta de historial de cambios sea visible, haga clic derecho en el Editor de Do-files, seleccione Preferencias... y marque o desmarque Historial de cambios en la pestaña General o Display.
Mejora en la truncación de nombres de variables en el Editor de Datos | Lanzado en agosto de 2025
En la cuadrícula del Editor de Datos, ahora puede seleccionar si los nombres de variables se truncarán al final (predeterminado), en el medio o 1, 2, 3 o 4 caracteres antes del final. Puede cambiar el comportamiento de truncado en el cuadro de diálogo de preferencias del Editor de Datos.
Requisitos del sistema
OS | Mac con Windows 10 y Apple Silicon y macOS 10.13 o posterior para Mac con procesadores Intel |
---|---|
Processor | Apple Silicon, procesador Intel o AMD (Core i3 o superior) |
Memory | Stata/MP > 4GB, Stata/SE > 2GB, and Stata/BE 1GB |
Hard Drive | 4 GB |
Stata en su investigación
Utilizado por cientos de miles de investigadores durante más de 40 años, Stata proporciona todo lo que necesita para la ciencia de datos: manipulación de datos, visualización, estadísticas e informes reproducibles.
Seleccione su disciplina y vea cómo Stata puede trabajar para usted.
Características para los científicos de datos
Preparación de datos
Extraiga datos de la web, impórtelos desde formatos estándar o cárguelos mediante SQL con JDBC u ODBC. Combine, vincule, anexe, reestructure, transponga, ordene y filtre. Stata maneja Unicode, marcos (múltiples conjuntos de datos en memoria), BLOBs, expresiones regulares y más, ya sea trabajando con cientos de miles o incluso miles de millones de puntos de datos.
Informes automatizados y tablas personalizables
Utilice Markdown para crear documentos de Word y archivos HTML con código, resultados y gráficos de Stata incrustados. Automatice informes en Word, PDF o Excel con capacidades de exportación de alto nivel y acceso programático detallado de bajo nivel para automatizar la producción de los documentos que su equipo necesita. Personalice tablas para comunicar claramente los resultados y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown.
Visualización
Cree gráficos y personalícelos de forma programática o interactiva con el Editor de gráficos. Las ediciones incluso pueden grabarse y 'reproducirse' en otros gráficos para garantizar la reproducibilidad. Exporte a formatos estándar de la industria adecuados para la web (SVG, PNG) o impresión (PDF, TIFF, EPS, PS).
Programación
Automatice todo su flujo de trabajo con scripts y funciones de programación completas como clases, estructuras y punteros. Una característica única del entorno de programación de Stata es Mata, un lenguaje de programación matricial rápido y compilado. Por supuesto, incluye todas las operaciones matriciales avanzadas que necesita. También tiene acceso a la potencia de LAPACK. Además, incluye solucionadores y optimizadores integrados para facilitar la implementación de su propio estimador. Y puede aprovechar todas las funciones de estimación y otras características de Stata desde Mata.
PyStata—Integración con Python
Intercambie código de Stata con código de Python. Puede transferir datos y resultados sin problemas entre Stata y Python. Puede usar Stata dentro de Jupyter Notebook y otros entornos de IPython. Puede llamar a bibliotecas de Python como NumPy, matplotlib, Scrapy, scikit-learn y más desde Stata. También puede usar análisis de Stata desde Python.
Interoperabilidad
Conéctese a código externo mediante complementos de Python, Java y C++. Escriba código Python o Java directamente dentro de su código de Stata. Controle Stata mediante Jupyter Notebook, OLE Automation o ejecútelo en modo por lotes. Escriba sentencias SQL personalizadas con JDBC y ODBC para extraer o cargar datos en bases de datos. Acceda a clústeres H2O.
Estadística y modelado
Incorpore modelos estadísticos de última generación y sus resultados en su flujo de trabajo. Encuentre grupos en sus datos utilizando técnicas no supervisadas como análisis de conglomerados, componentes principales, análisis factorial, escalamiento multidimensional y análisis de correspondencias. Comprenda aún mejor sus grupos usando análisis de clases latentes. Cuando su análisis requiera técnicas supervisadas, Stata dispone de métodos no paramétricos flexibles y una amplia gama de modelos de regresión, desde modelos lineales y logísticos hasta modelos de mezcla. Stata responde cuando sus datos requieren técnicas especiales. Tiene acceso a métodos que entienden y aprovechan la estructura en series temporales, datos de panel, datos de supervivencia, encuestas complejas, datos espaciales y datos multinivel. Stata ofrece las implementaciones más accesibles de métodos bayesianos y modelado de ecuaciones estructurales disponibles en cualquier parte. Puede solicitar métodos bootstrap para prácticamente cualquier estimador. Cuando su análisis lo requiera, Stata automatiza otros métodos de replicación y simulaciones.
Reproducibilidad
Stata es el único software para ciencia de datos y análisis estadístico que cuenta con un sistema integral de control de versiones que garantiza que su código siga funcionando, sin alteraciones, incluso después de actualizaciones o nuevas versiones. No es necesario conservar múltiples instalaciones antiguas para evitar romper su sistema; el código de Stata de hace 25 años aún puede ejecutarse sin modificación. Los conjuntos de datos, gráficos, scripts, programas y más son 100% multiplataforma y compatibles hacia atrás.
Lasso
Use lasso y elastic net para la selección de modelos y la predicción. Y cuando quiera estimar efectos y probar coeficientes para algunas variables de interés, los métodos inferenciales proporcionan estimaciones para estas variables mientras usan lasso para seleccionar entre un número potencialmente grande de variables de control. Incluso puede tener en cuenta covariables endógenas. Ya sea que su objetivo sea la selección de modelos, la predicción o la inferencia, puede usar las funciones lasso de Stata con resultados continuos, binarios, de conteo o de tiempo hasta el evento.
Características para economistas
Datos de panel
Aproveche al máximo la información adicional que proporcionan los datos de panel, manejando al mismo tiempo sus particularidades. Estudie las características invariantes en el tiempo dentro de cada panel, las relaciones entre paneles y cómo cambian a lo largo del tiempo los resultados de interés. Ajuste modelos lineales o no lineales para resultados binarios, de conteo, ordinales, censurados o de supervivencia con estimadores de efectos fijos, efectos aleatorios o promedios poblacionales. Ajuste modelos dinámicos o modelos con endogeneidad.
Series temporales
Aborde los retos estadísticos inherentes a los datos de series temporales: autocorrelaciones, factores comunes, heterocedasticidad condicional autorregresiva, raíces unitarias, cointegración y mucho más. Analice series temporales univariadas usando ARIMA, ARFIMA, modelos de cambio de régimen de Markov, modelos ARCH y GARCH, y modelos de componentes no observados. Compare modelos ARIMA o ARFIMA usando AIC, BIC y HQIC, y seleccione el mejor número de términos autorregresivos y de media móvil. Analice series temporales multivariadas usando VAR, VAR estructural, VEC, GARCH multivariado, modelos de factores dinámicos y modelos de espacio de estados. Calcule y grafique respuestas al impulso. Pruebe la existencia de raíces unitarias. Realice análisis bayesiano de series temporales.
Modelos de corte transversal
Ajuste modelos lineales clásicos de la relación entre un resultado continuo, como el salario, y los determinantes del salario, como el nivel educativo, la edad, la experiencia y el sector económico. Si su variable respuesta es binaria (por ejemplo, empleado o desempleado), ordinal (nivel educativo), de conteo (número de hijos) o censurada (ventas de boletos en un local existente), no se preocupe. Stata dispone de estimadores de máxima verosimilitud—probit, probit ordenado, Poisson, tobit y muchos otros—que estiman la relación entre dichos resultados y sus determinantes. Hay disponible una amplia gama de herramientas para analizar estos modelos. Prediga resultados y sus intervalos de confianza. Pruebe la igualdad de parámetros o cualquier combinación lineal o no lineal de parámetros.
Endogeneidad y selección
Cuando las variables explicativas están relacionadas con variables observables omitidas, con variables no observables o cuando hay sesgo de selección, las relaciones causales se ven distorsionadas y los estimadores estándar producen estimaciones inconsistentes de las verdaderas relaciones. Stata puede ajustar modelos consistentes cuando existe dicha endogeneidad o selección, ya sea que su variable de resultado sea continua, binaria, de conteo u ordinal, y ya sea que sus datos sean de corte transversal o de panel. Stata incluso puede combinar covariables endógenas, selección y efectos de tratamiento en el mismo modelo.
Inferencia causal/Efectos de tratamiento
Estime efectos causales de estilo experimental a partir de datos observacionales; por ejemplo, estime el efecto de un programa de capacitación laboral en el empleo o el efecto de un subsidio en la producción. Ajuste modelos para resultados continuos, binarios, de conteo, fraccionarios y de supervivencia con tratamientos binarios o multivaluados utilizando ponderación por probabilidad inversa (IPW), emparejamiento por puntaje de propensión, emparejamiento por vecino más cercano, ajuste por regresión o estimadores doblemente robustos. Ajuste modelos con tratamientos exógenos o endógenos. Después de la estimación, pruebe el supuesto de solapamiento y el equilibrio de covariables. Añada covariables endógenas y selección de muestra a algunos estimadores de efectos de tratamiento. En presencia de efectos de grupo y de tiempo, puede usar estimadores de diferencias en diferencias (DID) y diferencias triples (DDD). En presencia de covariables de alta dimensión, puede usar lasso. Si los efectos causales están mediados por otra variable, utilice la mediación causal con mediate para separar los efectos directos e indirectos.
Efectos marginales y medias marginales
Los efectos marginales y las medias marginales le permiten analizar y visualizar las relaciones entre su variable de resultado y sus covariables, incluso cuando ese resultado es binario, de conteo, ordinal, categórico o censurado (tobit). Estime efectos marginales promediados en la población o evalúe efectos marginales en valores interesantes o representativos de las covariables. Analice el efecto de las interacciones. Incluso puede trazar el efecto marginal en un rango de valores interesantes de covariables o interacciones de covariables. Puede hacer todo esto con medias marginales (a veces llamadas medias de resultados potenciales), incluso cuando su “media” es la probabilidad de un resultado positivo o un conteo de un modelo Poisson. Si tiene datos de panel y efectos aleatorios, estos se integran automáticamente para proporcionar efectos marginales (es decir, promediados en la población).
Modelos de elección
Modele sus datos de elección discreta. Si su resultado es, por ejemplo, elegir viajar en autobús, tren, coche o avión, puede ajustar un modelo logit condicional, probit multinomial o logit mixto. ¿Su resultado es en cambio una clasificación de métodos de viaje preferidos? Ajuste un probit ordenado por rango o un logit ordenado por rango. Independientemente del modelo ajustado, puede usar margins para interpretar fácilmente los resultados. Estime cuánto influyen los tiempos de espera en el aeropuerto en la probabilidad de viajar en avión o incluso en tren.
GMM
El GMM (método generalizado de momentos) puede utilizarse para ajustar casi cualquier modelo estadístico, incluidos problemas de estimación exactamente identificados y sobreidentificados. Los problemas sobreidentificados surgen cuando hay endogeneidad, correlación en paneles dinámicos, selección de muestra y muchas otras situaciones. Con Stata, usted estima estos modelos simplemente escribiendo sus momentos y encerrando los parámetros entre llaves. Puede ajustar fácilmente modelos de corte transversal, series temporales, datos de panel o datos de supervivencia y probar sus restricciones de sobreidentificación.
Sistemas de demanda
Ajuste sistemas de demanda para explorar la demanda de bienes y servicios por parte de los consumidores. Dado un presupuesto y un conjunto de bienes y servicios, determine las elasticidades de gasto y precio para estos bienes. Elija entre el sistema Cobb–Douglas, el sistema de gasto lineal de Stone, el sistema de demanda de utilidad indirecta translog, el sistema de demanda casi ideal (AIDS), el sistema de demanda casi ideal cuadrático (QUAIDS) y otros.
Lasso
Use lasso y elastic net para la selección de modelos y la predicción. Y cuando quiera estimar efectos y probar coeficientes para algunas variables de interés, los métodos inferenciales proporcionan estimaciones para estas variables mientras usan lasso para seleccionar entre un número potencialmente grande de variables de control. Incluso puede tener en cuenta covariables endógenas. Ya sea que su objetivo sea la selección de modelos, la predicción o la inferencia, puede usar las funciones lasso de Stata con resultados continuos, binarios, de conteo o de tiempo hasta el evento.
Programación
¿Quiere programar sus propios comandos para realizar estimaciones, gestionar datos o implementar nuevas funciones? Stata es programable y miles de usuarios han implementado y publicado miles de comandos comunitarios. Estos comandos se comportan como comandos oficiales de Stata y se instalan fácilmente y de forma gratuita desde Internet dentro de Stata. Una característica única del entorno de programación de Stata es Mata, un lenguaje rápido y compilado con soporte para tipos matriciales. Por supuesto, tiene todas las operaciones matriciales avanzadas que necesita. También tiene acceso a la potencia de LAPACK. Además, incluye solucionadores y optimizadores integrados para facilitar la implementación de su propio estimador de máxima verosimilitud, GMM u otros. Y puede aprovechar todas las funciones de estimación y otras características de Stata desde Mata. Muchos de los comandos oficiales de Stata están implementados en Mata.
PyStata - Integración con Python
Intercambie código de Stata con código de Python. Puede transferir datos y resultados sin problemas entre Stata y Python. Puede usar Stata dentro de Jupyter Notebook y otros entornos de IPython. Puede llamar a bibliotecas de Python como NumPy, matplotlib, Scrapy, scikit-learn y más desde Stata. También puede usar análisis de Stata desde Python.
Pronósticos
Construya modelos multiecuación y genere pronósticos de niveles, tendencias, tasas, etc. Ya sea que tenga un modelo pequeño con unas pocas ecuaciones o un modelo completo de la economía con miles de ecuaciones, Stata puede ayudarle a construir ese modelo y producir pronósticos. Su modelo puede incluir tanto relaciones estimadas como identidades conocidas. Puede crear y comparar fácilmente pronósticos bajo diferentes escenarios, crear pronósticos estáticos y dinámicos e incluso estimar intervalos de confianza estocásticos. Puede crear su modelo utilizando una sintaxis de comandos intuitiva o mediante el panel de control interactivo de pronósticos.
Análisis de supervivencia
Analice resultados de duración—tiempo hasta un evento como fallo o muerte—usando las herramientas especializadas de Stata para análisis de supervivencia. Tenga en cuenta las complicaciones inherentes a los datos de supervivencia, como no observar el evento (censura por la derecha, por la izquierda e intervalar), la entrada tardía de individuos al estudio y la observación no continua de individuos (lagunas). Puede estimar y graficar la probabilidad de supervivencia a lo largo del tiempo. O modelar la supervivencia como función de covariables usando modelos de regresión de Cox, Weibull, lognormal y otros. Prediga razones de riesgo, tiempo medio de supervivencia y probabilidades de supervivencia. ¿Tiene grupos de individuos en su estudio? Ajuste por correlación dentro de grupo con un modelo de efectos aleatorios o de fragilidad compartida. Si tiene muchas covariables potenciales, use lasso cox y elasticnet cox para la selección de modelos y la predicción.
Análisis bayesiano
Realice análisis econométricos bayesianos utilizando uno de los métodos de Monte Carlo con cadenas de Markov (MCMC). Puede elegir entre varios modelos compatibles, como modelos de datos de panel, jerárquicos, VAR y DSGE, o incluso programar el suyo propio. Hay disponibles amplias herramientas para verificar la convergencia, incluidas múltiples cadenas. Calcule estimaciones de la media posterior e intervalos creíbles para los parámetros del modelo y funciones de los parámetros del modelo. Puede realizar pruebas de hipótesis basadas en intervalos o en modelos. Compare modelos usando factores de Bayes. Calcule el ajuste del modelo usando valores predictivos posteriores. Genere predicciones y pronósticos. Si desea tener en cuenta la incertidumbre del modelo en su modelo de regresión, utilice el promedio de modelos bayesianos.
Métodos de encuestas
Ya sea que sus datos requieran un ajuste ponderado simple debido a tasas de muestreo diferenciales o que tenga datos de una encuesta compleja por etapas, las funciones de encuestas de Stata pueden proporcionarle errores estándar e intervalos de confianza correctos para sus inferencias. Simplemente especifique las características relevantes de su diseño de muestreo, como ponderaciones (incluidas ponderaciones en múltiples etapas), conglomeración (en una, dos o más etapas), estratificación y post-estratificación. Después de eso, la mayoría de los comandos de estimación de Stata pueden ajustar sus estimaciones para corregir su diseño de muestreo.
Meta-análisis
Combine los resultados de múltiples estudios para estimar un efecto general. Utilice gráficos de bosque para visualizar resultados. Use análisis por subgrupos y meta-regresión para explorar la heterogeneidad de los estudios. Use gráficos de embudo y pruebas formales para explorar el sesgo de publicación y los efectos de estudios pequeños. Utilice análisis de recorte y relleno para evaluar el impacto del sesgo de publicación en los resultados. Realice meta-análisis acumulativos y de exclusión de un estudio a la vez. Realice meta-análisis univariado, multinivel y multivariado. Utilice la suite meta o deje que la interfaz del Panel de control lo guíe en todo su meta-análisis.
Informes automatizados y tablas personalizables
Stata está diseñado para investigación reproducible, incluyendo la capacidad de crear documentos dinámicos que incorporen los resultados de su análisis. Cree archivos de Word o PDF, llene hojas de cálculo de Excel con resultados y deles formato a su gusto, y combine Markdown, HTML, resultados de Stata y gráficos de Stata, todo desde dentro de Stata. Cree tablas que comparen resultados de regresión o estadísticas resumidas, use estilos predeterminados o aplique los suyos propios, y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown e inclúyalas en sus informes.
Funciones para la educación
Modelos multinivel de efectos mixtos
Ya sea que las agrupaciones en sus datos surjan de manera anidada (estudiantes anidados en aulas y aulas anidadas en escuelas) o de manera no anidada (escuela primaria cruzada con escuela secundaria), puede ajustar un modelo multinivel para tener en cuenta la falta de independencia dentro de estos grupos. Ajuste modelos para resultados continuos, binarios, de conteo, ordinales y de supervivencia. Estime las varianzas de interceptos aleatorios y coeficientes aleatorios. Calcule correlaciones intraclase. Prediga efectos aleatorios. Estime relaciones promediadas en la población sobre los efectos aleatorios.
Modelado de ecuaciones estructurales (SEM)
Estime efectos de mediación, analice la relación entre un concepto latente no observado como las habilidades verbales y las variables observadas que miden dichas habilidades, o ajuste un modelo con relaciones complejas entre variables latentes y observadas. Ajuste modelos con resultados continuos, binarios, de conteo y ordinales. Incluso ajuste modelos jerárquicos con grupos de observaciones correlacionadas, como niños dentro de las mismas escuelas. Evalúe el ajuste del modelo. Calcule efectos indirectos y totales. Ajuste modelos dibujando un diagrama de rutas o utilizando la sintaxis de comandos directa.
Modelos lineales generales
Ajuste modelos de uno y dos factores. O ajuste modelos con tres, cuatro o incluso más factores. Analice datos con factores anidados, con factores fijos y aleatorios, o con medidas repetidas. Utilice modelos ANCOVA cuando tenga covariables continuas y modelos MANOVA cuando tenga múltiples variables de resultado. Explore más a fondo las relaciones entre su resultado y los predictores estimando tamaños del efecto y calculando medias de mínimos cuadrados y medias marginales. Realice contrastes y comparaciones por pares. Analice e ilustre interacciones.
IRT (teoría de respuesta al ítem)
Explore la relación entre características latentes no observadas, como la aptitud matemática, y la probabilidad de responder correctamente a preguntas de un examen (ítems). O explore la relación entre la satisfacción laboral de los docentes y sus respuestas autoinformadas a preguntas relacionadas con la satisfacción laboral. IRT puede usarse para crear medidas de dichos rasgos no observados o para ubicar a individuos en una escala que mide el rasgo. También puede usarse para seleccionar los mejores ítems para medir un rasgo latente. Los modelos IRT están disponibles para ítems de respuesta binaria, graduada, valorada, de crédito parcial y nominal. Visualice las relaciones mediante curvas características de los ítems y mida el rendimiento general de la prueba utilizando funciones de información del test.
Regresiones lineales, binarias y de conteo
Ajuste modelos clásicos de regresión lineal de la relación entre un resultado continuo, como una puntuación en una prueba de lectura, y los determinantes de la puntuación, como el método de enseñanza y el nivel de lectura del estudiante en el curso anterior. Si su respuesta es binaria (por ejemplo, aprobar o reprobar un examen), ordinal (nivel educativo), de conteo (número de estudiantes) o categórica (escuela privada, pública o en casa), no se preocupe. Stata dispone de estimadores de máxima verosimilitud—logística, logística ordenada, Poisson, logit multinomial y muchos otros—que estiman la relación entre dichos resultados y sus determinantes. Una amplia gama de herramientas está disponible tras ajustar estos modelos. Prediga resultados y sus intervalos de confianza. Pruebe la igualdad de parámetros. Calcule combinaciones lineales y no lineales de parámetros.
Regresiones lineales, binarias y de conteo
Tenga en cuenta los datos faltantes en su muestra utilizando imputación múltiple. Elija entre métodos univariados y multivariados para imputar valores faltantes en variables continuas, censuradas, truncadas, binarias, ordinales, categóricas y de conteo. Luego, en un solo paso, estime parámetros usando los conjuntos de datos imputados y combine los resultados. Ajuste un modelo lineal, logit, Poisson, jerárquico, de supervivencia o uno de los muchos otros modelos compatibles. Use el comando mi o deje que la interfaz del Panel de control lo guíe a través de todo su análisis de MI.
Modelos de elección
Modele sus datos de elección discreta. Si su resultado es, por ejemplo, elegir viajar en autobús, tren, coche o avión, puede ajustar un logit condicional, un probit multinomial o un logit mixto. ¿Su resultado es en cambio una clasificación de métodos de viaje preferidos? Ajuste un probit ordenado por rango o un logit ordenado por rango. Independientemente del modelo ajustado, puede usar margins para interpretar fácilmente los resultados. Estime cuánto influyen los tiempos de espera en el aeropuerto en la probabilidad de viajar en avión o incluso en tren.
Contrastes, medias marginales y gráficos de perfil
Obtenga rápida y fácilmente contrastes para variables categóricas y sus interacciones. R.edlevel le dará todos los contrastes de nivel educativo con una categoría de referencia. A.edlevel le dará cada contraste por pares con el siguiente nivel educativo superior. Existen muchos más contrastes con nombre y puede especificar los suyos propios. Si no le gusta escribir, use un cuadro de diálogo para seleccionar sus contrastes. Las medias marginales están a solo un comando o clic de distancia después de casi cualquier comando de estimación. Evaluar los efectos de interacción, los efectos de variables moderadoras, es igual de fácil. Y esto no es solo para modelos lineales, sino también para modelos con resultados binarios, ordinales y de conteo. Incluso para modelos jerárquicos con un manejo correcto de los efectos aleatorios. Un simple comando o unos pocos clics le darán un gráfico de perfil de cualquiera de estos resultados.
Poder, precisión y tamaño de muestra
Antes de realizar su experimento, determine el tamaño de muestra necesario
Características para epidemiólogos
Tablas epidemiológicas
¿Quiere analizar datos de un estudio prospectivo, un estudio de cohorte, un estudio de casos y controles o un estudio de casos y controles emparejados? Las tablas de Stata para epidemiólogos facilitan resumir sus datos y calcular estadísticas como razones de tasas de incidencia, diferencias de tasas de incidencia, razones de riesgo, diferencias de riesgo, razones de momios y fracciones atribuibles. También puede analizar datos estratificados: calcular estimaciones combinadas de Mantel–Haenszel, realizar pruebas de homogeneidad y estandarizar estimaciones. Si tiene una exposición ordinal en lugar de binaria, puede realizar una prueba de tendencia.
Análisis de supervivencia
Analice resultados de duración—resultados que miden el tiempo hasta un evento como fallo o muerte—usando las herramientas especializadas de Stata para análisis de supervivencia. Tenga en cuenta las complicaciones inherentes a los datos de supervivencia, como no observar el evento (censura por la derecha, por la izquierda e intervalar), la entrada tardía de individuos al estudio y la observación no continua de individuos (lagunas). Puede estimar y graficar la probabilidad de supervivencia a lo largo del tiempo. O modelar la supervivencia como función de covariables usando modelos de regresión de Cox, Weibull, lognormal y otros. Prediga razones de riesgo, tiempo medio de supervivencia y probabilidades de supervivencia. ¿Tiene grupos de individuos en su estudio? Ajuste por correlación dentro de grupo con un modelo de efectos aleatorios o de fragilidad compartida. Si tiene muchas covariables potenciales, use lasso cox y elasticnet cox para la selección de modelos y la predicción.
Regresiones lineales, binarias y de conteo
Ajuste modelos clásicos de ANOVA y de regresión lineal para la relación entre un resultado continuo, como el peso, y los determinantes del peso, como la altura, la dieta y el nivel de ejercicio. Si su respuesta es binaria, ordinal, categórica o de conteo, no se preocupe. Stata tiene estimadores para estos tipos de resultados también. Use regresión logística para ajustar razones de momios por variables de confusión. Estime tasas de incidencia usando un modelo Poisson. Analice datos de casos y controles emparejados con regresión logística condicional. Una amplia gama de herramientas está disponible después de ajustar estos modelos. Prediga resultados e intervalos de confianza. Pruebe la igualdad de parámetros. Calcule combinaciones lineales y no lineales de parámetros.
Métodos de encuestas
Ya sea que sus datos requieran un ajuste ponderado simple debido a tasas de muestreo diferenciales o que tenga datos de una encuesta compleja por etapas, las funciones de encuestas de Stata pueden proporcionarle errores estándar e intervalos de confianza correctos para sus inferencias. Simplemente especifique las características relevantes de su diseño de muestreo, como ponderaciones (incluidas ponderaciones en múltiples etapas), conglomeración (en una, dos o más etapas), estratificación y post-estratificación. Después de eso, la mayoría de los comandos de estimación de Stata pueden ajustar sus estimaciones para corregir su diseño de muestreo.
Medias marginales, contrastes e interacciones
Las medias marginales y los contrastes le permiten analizar las relaciones entre su variable de resultado y sus predictores, incluso cuando su resultado es binario, de conteo, ordinal o categórico. Por ejemplo, después de ajustar una regresión logística de una enfermedad sobre una variable de exposición y otras covariables, sus medias marginales pueden ser riesgos promediados en la población. O puede fijar las covariables en valores de interés para calcular riesgos ajustados y luego usar contrastes para obtener diferencias de riesgo ajustadas. Después de ajustar casi cualquier modelo en Stata, puede analizar el efecto de las interacciones de covariables y crear fácilmente gráficos para visualizar esas interacciones.
Poder, precisión y tamaño de muestra
Antes de realizar su experimento, determine el tamaño de muestra necesario para detectar efectos significativos sin desperdiciar recursos. ¿Desea calcular IC para medias o varianzas o realizar pruebas para proporciones o correlaciones? ¿Planea ajustar un modelo de riesgos proporcionales de Cox o comparar funciones de supervivencia usando una prueba log-rank? ¿Quiere usar una prueba de asociación de Cochran—Mantel—Haenszel o una prueba de tendencia de Cochran—Armitage? Use el comando power de Stata para calcular potencia y tamaño de muestra, crear tablas personalizadas y graficar automáticamente las relaciones entre potencia, tamaño de muestra y tamaño del efecto para su estudio planificado. O use el comando ciwidth para hacer lo mismo pero para IC en lugar de pruebas de hipótesis calculando el tamaño de muestra requerido para la precisión deseada del IC. O use gsdesign para calcular límites de detención y tamaños de muestra requeridos para diseños secuenciales por grupos. En lugar de comandos, use el Panel de control interactivo para realizar su análisis.
Meta-análisis
Combine los resultados de múltiples estudios para estimar un efecto general. Utilice gráficos de bosque para visualizar resultados. Use análisis por subgrupos y meta-regresión para explorar la heterogeneidad de los estudios. Use gráficos de embudo y pruebas formales para explorar el sesgo de publicación y los efectos de estudios pequeños. Utilice análisis de recorte y relleno para evaluar el impacto del sesgo de publicación en los resultados. Realice meta-análisis acumulativos y de exclusión de un estudio a la vez. Realice meta-análisis univariado, multinivel y multivariado. Utilice la suite meta o deje que la interfaz del Panel de control lo guíe en todo su meta-análisis.
Inferencia causal
Estime efectos causales de estilo experimental a partir de datos observacionales. Con los estimadores de efectos de tratamiento de Stata, puede usar un marco de resultados potenciales (contrafactuales) para estimar, por ejemplo, el efecto de la estructura familiar en el desarrollo infantil o el efecto del desempleo en la ansiedad. Ajuste modelos para resultados continuos, binarios, de conteo, fraccionarios y de supervivencia con tratamientos binarios o multivaluados utilizando ponderación por probabilidad inversa (IPW), emparejamiento por puntaje de propensión, emparejamiento por vecino más cercano, ajuste por regresión o estimadores doblemente robustos. Si la asignación a un tratamiento no es independiente del resultado, puede usar un estimador de efectos de tratamiento endógeno. En presencia de efectos de grupo y de tiempo, puede usar estimadores de diferencias en diferencias (DID) y diferencias triples (DDD). En presencia de covariables de alta dimensión, puede usar lasso. Si los efectos causales están mediados por otra variable, utilice mediación causal con mediate para separar efectos directos e indirectos.
Imputación múltiple
Tenga en cuenta los datos faltantes en su muestra utilizando imputación múltiple. Elija entre métodos univariados y multivariados para imputar valores faltantes en variables continuas, censuradas, truncadas, binarias, ordinales, categóricas y de conteo. Luego, en un solo paso, estime parámetros usando los conjuntos de datos imputados y combine los resultados. Ajuste un modelo lineal, logit, Poisson, multinivel, de supervivencia o uno de los muchos otros modelos compatibles. Use el comando mi o deje que la interfaz del Panel de control lo guíe a través de todo su análisis de MI.
Modelos multinivel de efectos mixtos
Ya sea que las agrupaciones en sus datos surjan de manera anidada (pacientes anidados en clínicas y clínicas anidadas en regiones) o de manera no anidada (regiones cruzadas con ocupaciones), puede ajustar un modelo multinivel para tener en cuenta la falta de independencia dentro de estos grupos. Ajuste modelos para resultados continuos, binarios, de conteo, ordinales y de supervivencia. Estime las varianzas de interceptos aleatorios y coeficientes aleatorios. Calcule correlaciones intraclase. Prediga efectos aleatorios. Estime relaciones promediadas en la población sobre los efectos aleatorios.
Análisis bayesiano
Ajuste modelos de regresión bayesiana utilizando uno de los métodos de Monte Carlo con cadenas de Markov (MCMC). Puede elegir entre varios modelos compatibles o incluso programar el suyo propio. Hay disponibles amplias herramientas para verificar la convergencia, incluidas múltiples cadenas. Calcule estimaciones de la media posterior e intervalos creíbles para los parámetros del modelo y funciones de los parámetros del modelo. Puede realizar pruebas de hipótesis basadas en intervalos o en modelos. Compare modelos usando factores de Bayes. Calcule el ajuste del modelo usando valores predictivos posteriores y genere predicciones. Si desea tener en cuenta la incertidumbre del modelo en su modelo de regresión, utilice el promedio de modelos bayesianos.
Modelos aditivos de riesgo relativo
Determine cómo interactúan las exposiciones para poner a los sujetos en mayor riesgo de experimentar un resultado de interés. Por ejemplo, podría investigar cómo la exposición al humo de cigarrillo y al asbesto interactúan para aumentar el riesgo de cáncer de pulmón. Con el comando reri de Stata, puede medir interacciones bidireccionales en un modelo aditivo de riesgo relativo, teniendo en cuenta otros factores de riesgo. Elija entre varios modelos compatibles, como lineal generalizado binomial, Poisson, binomial negativa, logística, Cox, supervivencia paramétrica, y supervivencia paramétrica y semiparamétrica con censura por intervalos. Estime el exceso de riesgo relativo debido a la interacción (RERI), la proporción atribuible (AP) y el índice de sinergia (SI).
Informes automatizados y tablas personalizables
Stata está diseñado para investigación reproducible, incluyendo la capacidad de crear documentos dinámicos que incorporen los resultados de su análisis. Cree archivos de Word o PDF, llene hojas de cálculo de Excel con resultados y deles formato a su gusto, y combine Markdown, HTML, resultados de Stata y gráficos de Stata, todo desde dentro de Stata. Cree tablas que comparen resultados de regresión o estadísticas resumidas, use estilos predeterminados o aplique los suyos propios, y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown e inclúyalas en sus informes.
Jupyter Notebook con Stata
Jupyter Notebook es ampliamente utilizado por investigadores y científicos para compartir sus ideas y resultados con fines de colaboración e innovación. Es una aplicación web fácil de usar que le permite combinar código, visualizaciones, fórmulas matemáticas, texto narrativo y otros medios enriquecidos en un solo documento (un 'notebook') para computación interactiva y desarrollo. Puede invocar Stata y Mata desde Jupyter Notebook con el kernel IPython (Python interactivo). Esto significa que puede combinar las capacidades de Python y Stata en un solo entorno para que su trabajo sea fácilmente reproducible y compartible con otros.
Características para bioestadísticos
Análisis de supervivencia
Analice resultados de duración—resultados que miden el tiempo hasta un evento como fallo o muerte—usando las herramientas especializadas de Stata para análisis de supervivencia. Tenga en cuenta las complicaciones inherentes a los datos de supervivencia, como no observar el evento (censura por la derecha, por la izquierda e intervalar), la entrada tardía de individuos al estudio y la observación no continua de individuos (lagunas). Puede estimar y graficar la probabilidad de supervivencia a lo largo del tiempo. O modelar la supervivencia como función de covariables usando modelos de regresión de Cox, Weibull, lognormal y otros. Prediga razones de riesgo, tiempo medio de supervivencia y probabilidades de supervivencia. ¿Tiene grupos de individuos en su estudio? Ajuste por correlación dentro de grupo con un modelo de efectos aleatorios o de fragilidad compartida. Si tiene muchas covariables potenciales, use lasso cox y elasticnet cox para la selección de modelos y la predicción.
Modelos multinivel de efectos mixtos
Ya sea que las agrupaciones en sus datos surjan de manera anidada (pacientes anidados en clínicas y clínicas anidadas en regiones) o de manera no anidada (regiones cruzadas con ocupaciones), puede ajustar un modelo multinivel para tener en cuenta la falta de independencia dentro de estos grupos. Ajuste modelos para resultados continuos, binarios, de conteo, ordinales y de supervivencia. Estime las varianzas de interceptos aleatorios y coeficientes aleatorios. Calcule correlaciones intraclase. Prediga efectos aleatorios. Estime relaciones promediadas en la población sobre los efectos aleatorios.
Análisis bayesiano
Ajuste modelos de regresión bayesiana utilizando uno de los métodos de Monte Carlo con cadenas de Markov (MCMC). Puede elegir entre varios modelos compatibles o incluso programar el suyo propio. Hay disponibles amplias herramientas para verificar la convergencia, incluidas múltiples cadenas. Calcule estimaciones de la media posterior e intervalos creíbles para los parámetros del modelo y funciones de los parámetros del modelo. Puede realizar pruebas de hipótesis basadas en intervalos o en modelos. Compare modelos usando factores de Bayes. Calcule el ajuste del modelo usando valores predictivos posteriores y genere predicciones. Si desea tener en cuenta la incertidumbre del modelo en su modelo de regresión, utilice el promedio de modelos bayesianos.
Poder, precisión y tamaño de muestra
Antes de realizar su experimento, determine el tamaño de muestra necesario para detectar efectos significativos sin desperdiciar recursos. ¿Desea calcular IC para medias o varianzas o realizar pruebas para proporciones o correlaciones? ¿Planea ajustar un modelo de riesgos proporcionales de Cox o comparar funciones de supervivencia usando una prueba log-rank? ¿Quiere usar una prueba de asociación de Cochran—Mantel—Haenszel o una prueba de tendencia de Cochran—Armitage? Use el comando power de Stata para calcular potencia y tamaño de muestra, crear tablas personalizadas y graficar automáticamente las relaciones entre potencia, tamaño de muestra y tamaño del efecto para su estudio planificado. O use el comando ciwidth para hacer lo mismo pero para IC en lugar de pruebas de hipótesis calculando el tamaño de muestra requerido para la precisión deseada del IC. O use gsdesign para calcular límites de detención y tamaños de muestra requeridos para diseños secuenciales por grupos. En lugar de comandos, use el Panel de control interactivo para realizar su análisis.
Regresiones lineales, binarias y de conteo
Ajuste modelos clásicos de ANOVA y de regresión lineal para la relación entre un resultado continuo, como el peso, y los determinantes del peso, como la altura, la dieta y el nivel de ejercicio. Si su respuesta es binaria, ordinal, categórica o de conteo, no se preocupe. Stata tiene estimadores para estos tipos de resultados también. Use regresión logística para estimar razones de momios. Estime tasas de incidencia usando un modelo Poisson. Analice datos de casos y controles emparejados con regresión logística condicional. Una amplia gama de herramientas está disponible después de ajustar estos modelos. Prediga resultados e intervalos de confianza. Pruebe la igualdad de parámetros. Calcule combinaciones lineales y no lineales de parámetros.
Meta-análisis
Combine los resultados de múltiples estudios para estimar un efecto general. Utilice gráficos de bosque para visualizar resultados. Use análisis por subgrupos y meta-regresión para explorar la heterogeneidad de los estudios. Use gráficos de embudo y pruebas formales para explorar el sesgo de publicación y los efectos de estudios pequeños. Utilice análisis de recorte y relleno para evaluar el impacto del sesgo de publicación en los resultados. Realice meta-análisis acumulativos y de exclusión de un estudio a la vez. Realice meta-análisis univariado, multinivel y multivariado. Utilice la suite meta o deje que la interfaz del Panel de control lo guíe en todo su meta-análisis.
Imputación múltiple
Tenga en cuenta los datos faltantes en su muestra utilizando imputación múltiple. Elija entre métodos univariados y multivariados para imputar valores faltantes en variables continuas, censuradas, truncadas, binarias, ordinales, categóricas y de conteo. Luego, en un solo paso, estime parámetros usando los conjuntos de datos imputados y combine los resultados. Ajuste un modelo lineal, logit, Poisson, jerárquico, de supervivencia o uno de los muchos otros modelos compatibles. Use el comando mi o deje que la interfaz del Panel de control lo guíe a través de todo su análisis de MI.
Medias marginales, contrastes e interacciones
Las medias marginales y los contrastes le permiten analizar las relaciones entre su variable de resultado y sus covariables, incluso cuando ese resultado es binario, de conteo, ordinal, categórico o de supervivencia. Calcule predicciones ajustadas con las covariables fijadas en valores interesantes o representativos. O calcule medias marginales para cada nivel de una covariable categórica. Compare las predicciones ajustadas o las medias marginales utilizando contrastes. Si tiene datos multinivel y efectos aleatorios, estos se integran automáticamente para proporcionar estimaciones marginales (es decir, promediadas en la población). Después de ajustar casi cualquier modelo en Stata, analice el efecto de las interacciones de covariables y cree fácilmente gráficos para visualizar esas interacciones.
Inferencia causal
Estime efectos causales de estilo experimental a partir de datos observacionales. Con los estimadores de efectos de tratamiento de Stata, puede usar un marco de resultados potenciales (contrafactuales) para estimar, por ejemplo, el efecto de la estructura familiar en el desarrollo infantil o el efecto del desempleo en la ansiedad. Ajuste modelos para resultados continuos, binarios, de conteo, fraccionarios y de supervivencia con tratamientos binarios o multivaluados utilizando ponderación por probabilidad inversa (IPW), emparejamiento por puntaje de propensión, emparejamiento por vecino más cercano, ajuste por regresión o estimadores doblemente robustos. Si la asignación a un tratamiento no es independiente del resultado, puede usar un estimador de efectos de tratamiento endógeno. En presencia de efectos de grupo y de tiempo, puede usar estimadores de diferencias en diferencias (DID) y diferencias triples (DDD). En presencia de covariables de alta dimensión, puede usar lasso. Si los efectos causales están mediados por otra variable, utilice mediación causal con mediate para separar efectos directos e indirectos.
Tablas epidemiológicas
¿Quiere analizar datos de un estudio prospectivo (incidencia), un estudio de cohorte, un estudio de casos y controles o un estudio de casos y controles emparejados? Las tablas de Stata para epidemiólogos facilitan resumir sus datos y calcular estadísticas como razones de tasas de incidencia, diferencias de tasas de incidencia, razones de riesgo, diferencias de riesgo, razones de momios y fracciones atribuibles. También puede analizar datos estratificados: calcular estimaciones combinadas de Mantel–Haenszel, realizar pruebas de homogeneidad y estandarizar estimaciones. Si tiene una exposición ordinal en lugar de binaria, puede realizar una prueba de tendencia.
Programación
¿Quiere programar sus propios comandos para realizar estimaciones, gestionar datos o implementar nuevas funciones? Stata es programable y miles de usuarios han implementado y publicado miles de comandos comunitarios. Estos comandos se comportan como comandos oficiales de Stata y se instalan fácilmente y de forma gratuita desde Internet dentro de Stata. Una característica única del entorno de programación de Stata es Mata, un lenguaje rápido y compilado con soporte para tipos matriciales. Por supuesto, tiene todas las operaciones matriciales avanzadas que necesita. También tiene acceso a la potencia de LAPACK. Además, incluye solucionadores y optimizadores integrados para facilitar la implementación de su propio estimador de máxima verosimilitud, GMM u otros. Y puede aprovechar todas las funciones de estimación y otras características de Stata desde Mata. Muchos de los comandos oficiales de Stata están implementados en Mata.
PyStata - Integración con Python
Intercambie código de Stata con código de Python. Puede transferir datos y resultados sin problemas entre Stata y Python. Puede usar Stata dentro de Jupyter Notebook y otros entornos de IPython. Puede llamar a bibliotecas de Python como NumPy, matplotlib, Scrapy, scikit-learn y más desde Stata. También puede usar análisis de Stata desde Python.
Informes automatizados y tablas personalizables
Stata está diseñado para investigación reproducible, incluyendo la capacidad de crear documentos dinámicos que incorporen los resultados de su análisis. Cree archivos de Word o PDF, llene hojas de cálculo de Excel con resultados y deles formato a su gusto, y combine Markdown, HTML, resultados de Stata y gráficos de Stata, todo desde dentro de Stata. Cree tablas que comparen resultados de regresión o estadísticas resumidas, use estilos predeterminados o aplique los suyos propios, y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown e inclúyalas en sus informes.
Características para los investigadores médicos
Modelos lineales generales
Ajuste modelos de uno y dos factores. O ajuste modelos con tres, cuatro o incluso más factores. Analice datos con factores anidados, con factores fijos y aleatorios, o con medidas repetidas. Utilice modelos ANCOVA cuando tenga covariables continuas y modelos MANOVA cuando tenga múltiples variables de resultado. Explore más a fondo las relaciones entre su resultado y los predictores estimando tamaños del efecto y calculando medias de mínimos cuadrados y medias marginales. Realice contrastes y comparaciones por pares. Analice e ilustre interacciones.
Regresiones lineales, binarias y de conteo
Ajuste modelos clásicos de ANOVA y de regresión lineal para la relación entre un resultado continuo, como el peso, y los determinantes del peso, como la altura, la dieta y el nivel de ejercicio. Si su respuesta es binaria, ordinal, categórica o de conteo, no se preocupe. Stata tiene estimadores para estos tipos de resultados también. Use regresión logística para estimar razones de momios. Estime tasas de incidencia usando un modelo Poisson. Analice datos de casos y controles emparejados con regresión logística condicional. Una amplia gama de herramientas está disponible después de ajustar estos modelos. Prediga resultados e intervalos de confianza. Pruebe la igualdad de parámetros. Calcule combinaciones lineales y no lineales de parámetros.
Poder, precisión y tamaño de muestra
Antes de realizar su experimento, determine el tamaño de muestra necesario para detectar efectos significativos sin desperdiciar recursos. ¿Desea calcular IC para medias o varianzas o realizar pruebas para proporciones o correlaciones? ¿Planea ajustar un modelo de riesgos proporcionales de Cox o comparar funciones de supervivencia usando una prueba log-rank? ¿Quiere usar una prueba de asociación de Cochran—Mantel—Haenszel o una prueba de tendencia de Cochran—Armitage? Use el comando power de Stata para calcular potencia y tamaño de muestra, crear tablas personalizadas y graficar automáticamente las relaciones entre potencia, tamaño de muestra y tamaño del efecto para su estudio planificado. O use el comando ciwidth para hacer lo mismo pero para IC en lugar de pruebas de hipótesis calculando el tamaño de muestra requerido para la precisión deseada del IC. O use gsdesign para calcular límites de detención y tamaños de muestra requeridos para diseños secuenciales por grupos. En lugar de comandos, use el Panel de control interactivo para realizar su análisis.
Medias marginales, contrastes e interacciones
Las medias marginales y los contrastes le permiten analizar las relaciones entre su variable de resultado y sus covariables, incluso cuando ese resultado es binario, de conteo, ordinal, categórico o de supervivencia. Calcule predicciones ajustadas con las covariables fijadas en valores interesantes o representativos. O calcule medias marginales para cada nivel de una covariable categórica. Compare las predicciones ajustadas o las medias marginales utilizando contrastes. Si tiene datos multinivel y efectos aleatorios, estos se integran automáticamente para proporcionar estimaciones marginales (es decir, promediadas en la población). Después de ajustar casi cualquier modelo en Stata, analice el efecto de las interacciones de covariables y cree fácilmente gráficos para visualizar esas interacciones.
Modelos multinivel de efectos mixtos
Ya sea que las agrupaciones en sus datos surjan de manera anidada (pacientes anidados en clínicas y clínicas anidadas en regiones) o de manera no anidada (regiones cruzadas con ocupaciones), puede ajustar un modelo multinivel para tener en cuenta la falta de independencia dentro de estos grupos. Ajuste modelos para resultados continuos, binarios, de conteo, ordinales y de supervivencia. Estime las varianzas de interceptos aleatorios y coeficientes aleatorios. Calcule correlaciones intraclase. Prediga efectos aleatorios. Estime relaciones promediadas en la población sobre los efectos aleatorios.
Meta-análisis
Combine los resultados de múltiples estudios para estimar un efecto general. Utilice gráficos de bosque para visualizar resultados. Use análisis por subgrupos y meta-regresión para explorar la heterogeneidad de los estudios. Use gráficos de embudo y pruebas formales para explorar el sesgo de publicación y los efectos de estudios pequeños. Utilice análisis de recorte y relleno para evaluar el impacto del sesgo de publicación en los resultados. Realice meta-análisis acumulativos y de exclusión de un estudio a la vez. Realice meta-análisis univariado, multinivel y multivariado. Utilice la suite meta o deje que la interfaz del Panel de control lo guíe en todo su meta-análisis.
Imputación múltiple
Tenga en cuenta los datos faltantes en su muestra utilizando imputación múltiple. Elija entre métodos univariados y multivariados para imputar valores faltantes en variables continuas, censuradas, truncadas, binarias, ordinales, categóricas y de conteo. Luego, en un solo paso, estime parámetros usando los conjuntos de datos imputados y combine los resultados. Ajuste un modelo lineal, logit, Poisson, jerárquico, de supervivencia o uno de los muchos otros modelos compatibles. Use el comando mi o deje que la interfaz del Panel de control lo guíe a través de todo su análisis de MI.
Análisis de supervivencia
Analice resultados de duración—resultados que miden el tiempo hasta un evento como fallo o muerte—usando las herramientas especializadas de Stata para análisis de supervivencia. Tenga en cuenta las complicaciones inherentes a los datos de supervivencia, como no observar el evento (censura por la derecha, por la izquierda e intervalar), la entrada tardía de individuos al estudio y la observación no continua de individuos (lagunas). Puede estimar y graficar la probabilidad de supervivencia a lo largo del tiempo. O modelar la supervivencia como función de covariables usando modelos de regresión de Cox, Weibull, lognormal y otros. Prediga razones de riesgo, tiempo medio de supervivencia y probabilidades de supervivencia. ¿Tiene grupos de individuos en su estudio? Ajuste por correlación dentro de grupo con un modelo de efectos aleatorios o de fragilidad compartida. Si tiene muchas covariables potenciales, use lasso cox y elasticnet cox para la selección de modelos y la predicción.
Tablas epidemiológicas
¿Quiere analizar datos de un estudio prospectivo (incidencia), un estudio de cohorte, un estudio de casos y controles o un estudio de casos y controles emparejados? Las tablas de Stata para epidemiólogos facilitan resumir sus datos y calcular estadísticas como razones de tasas de incidencia, diferencias de tasas de incidencia, razones de riesgo, diferencias de riesgo, razones de momios y fracciones atribuibles. También puede analizar datos estratificados: calcular estimaciones combinadas de Mantel–Haenszel, realizar pruebas de homogeneidad y estandarizar estimaciones. Si tiene una exposición ordinal en lugar de binaria, puede realizar una prueba de tendencia.
Modelos aditivos de riesgo relativo
Determine cómo interactúan las exposiciones para poner a los sujetos en mayor riesgo de experimentar un resultado de interés. Por ejemplo, podría investigar cómo la exposición al humo de cigarrillo y al asbesto interactúan para aumentar el riesgo de cáncer de pulmón. Con el comando reri de Stata, puede medir interacciones bidireccionales en un modelo aditivo de riesgo relativo, teniendo en cuenta otros factores de riesgo. Elija entre varios modelos compatibles, como lineal generalizado binomial, Poisson, binomial negativa, logística, Cox, supervivencia paramétrica, y supervivencia paramétrica y semiparamétrica con censura por intervalos. Estime el exceso de riesgo relativo debido a la interacción (RERI), la proporción atribuible (AP) y el índice de sinergia (SI).
Informes automatizados y tablas personalizables
Stata está diseñado para investigación reproducible, incluyendo la capacidad de crear documentos dinámicos que incorporen los resultados de su análisis. Cree archivos de Word o PDF, llene hojas de cálculo de Excel con resultados y deles formato a su gusto, y combine Markdown, HTML, resultados de Stata y gráficos de Stata, todo desde dentro de Stata. Cree tablas que comparen resultados de regresión o estadísticas resumidas, use estilos predeterminados o aplique los suyos propios, y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown e inclúyalas en sus informes.
Jupyter Notebook con Stata
Jupyter Notebook es ampliamente utilizado por investigadores y científicos para compartir sus ideas y resultados con fines de colaboración e innovación. Es una aplicación web fácil de usar que le permite combinar código, visualizaciones, fórmulas matemáticas, texto narrativo y otros medios enriquecidos en un solo documento (un 'notebook') para computación interactiva y desarrollo. Puede invocar Stata y Mata desde Jupyter Notebook con el kernel IPython (Python interactivo). Esto significa que puede combinar las capacidades de Python y Stata en un solo entorno para que su trabajo sea fácilmente reproducible y compartible con otros.
Características para sociólogos
Métodos de encuestas
Ya sea que sus datos requieran un simple ajuste ponderado debido a tasas de muestreo diferenciales o que tenga datos de una encuesta compleja por etapas múltiples, las funciones de encuestas de Stata pueden proporcionarle errores estándar correctos e intervalos de confianza precisos para sus inferencias. Simplemente especifique las características relevantes de su diseño de muestreo, como pesos de muestreo (incluyendo pesos en múltiples etapas), conglomerados (en una, dos o más etapas), estratificación y postestratificación. Después de eso, la mayoría de los comandos de estimación de Stata pueden ajustar sus estimaciones para corregir su diseño de muestreo.
Imputación múltiple
Tenga en cuenta los datos faltantes en su muestra utilizando imputación múltiple. Elija entre métodos univariados y multivariados para imputar valores faltantes en variables continuas, censuradas, truncadas, binarias, ordinales, categóricas y de conteo. Luego, en un solo paso, estime parámetros utilizando los conjuntos de datos imputados y combine los resultados. Ajuste un modelo lineal, logit, Poisson, multinivel, de supervivencia o uno de los muchos otros modelos compatibles. Utilice el comando mi o deje que la interfaz del Panel de control lo guíe a través de todo su análisis de MI.
Modelos multinivel de efectos mixtos
Ya sea que las agrupaciones en sus datos surjan de manera anidada (estudiantes anidados en escuelas y escuelas anidadas en distritos) o de manera no anidada (regiones cruzadas con ocupaciones), puede ajustar un modelo multinivel para tener en cuenta la falta de independencia dentro de estos grupos. Ajuste modelos para resultados continuos, binarios, de conteo, ordinales y de supervivencia. Estime varianzas de interceptos aleatorios y coeficientes aleatorios. Calcule correlaciones intraclase. Prediga efectos aleatorios. Estime relaciones promediadas en la población sobre los efectos aleatorios.
Datos de panel
Aproveche al máximo la información adicional que proporcionan los datos de panel y, al mismo tiempo, maneje las dificultades particulares que presentan. Estudie las características idiosincráticas invariantes en el tiempo dentro de cada panel, las relaciones entre paneles y cómo cambian con el tiempo los resultados de interés. Ajuste modelos lineales o no lineales para resultados binarios, de conteo, ordinales, censurados o de supervivencia con estimadores de efectos fijos, efectos aleatorios o promediados en la población. Ajuste modelos dinámicos o modelos con endogeneidad. Ajuste modelos bayesianos de datos de panel.
Meta-análisis
Combine resultados de múltiples estudios para estimar un efecto general. Utilice gráficos de bosque para visualizar resultados. Utilice análisis por subgrupos y meta-regresión para explorar la heterogeneidad de los estudios. Use gráficos de embudo y pruebas formales para explorar el sesgo de publicación y los efectos de estudios pequeños. Use análisis de recorte y relleno para evaluar el impacto del sesgo de publicación en los resultados. Realice meta-análisis acumulativos y de exclusión de un estudio a la vez. Realice meta-análisis univariado, multinivel y multivariado. Utilice la suite meta o deje que la interfaz del Panel de control lo guíe en todo su meta-análisis.
Regresiones lineales, binarias y de conteo
Ajuste modelos lineales clásicos de la relación entre un resultado continuo, como el salario, y los determinantes del salario, como el nivel educativo, la edad, la experiencia y el sector económico. Si su respuesta es binaria (por ejemplo, empleado o desempleado), ordinal (nivel educativo) o de conteo (número de hijos), no se preocupe. Stata cuenta con estimadores de máxima verosimilitud—probit, probit ordenado, Poisson y muchos otros—que estiman la relación entre estos resultados y sus determinantes. Una amplia gama de herramientas está disponible para analizar estos modelos. Prediga resultados y sus intervalos de confianza. Pruebe la igualdad de parámetros o cualquier combinación lineal o no lineal de parámetros.
Modelos de ecuaciones estructurales (SEM)
Estime efectos de mediación, analice la relación entre un concepto latente no observado, como el nivel de conservadurismo de una persona, y las variables observadas que miden dicho conservadurismo; modele un sistema con muchas variables endógenas y errores correlacionados; o ajuste un modelo con relaciones complejas entre variables latentes y observadas. Ajuste modelos con resultados continuos, binarios, de conteo, ordinales, fraccionales y de supervivencia. Incluso ajuste modelos multinivel con grupos de observaciones correlacionadas, como niños dentro de las mismas escuelas. Evalúe el ajuste del modelo. Calcule efectos indirectos y totales. Ajuste modelos dibujando un diagrama de ruta o usando una sintaxis de comando sencilla.
Predicciones ajustadas, interacciones y moderación
Las predicciones ajustadas y las medias marginales le permiten analizar las relaciones entre su variable de resultado y sus covariables, incluso cuando ese resultado es binario, de conteo, ordinal o categórico. Calcule predicciones ajustadas con covariables fijadas en valores interesantes o representativos. O calcule medias marginales para cada nivel de una covariable categórica. Compare las predicciones ajustadas o las medias marginales usando contrastes. Si tiene datos multinivel o de panel y efectos aleatorios, estos se integran automáticamente para proporcionar estimaciones marginales (es decir, promediadas en la población). Después de ajustar casi cualquier modelo en Stata, analice el efecto de variables moderadoras y cree fácilmente gráficos de interacción.
Modelos de elección
Modele sus datos de elección discreta. Si su resultado es, por ejemplo, la decisión de graduados de secundaria de asistir a la universidad, asistir a una escuela técnica o trabajar, puede ajustar un modelo logit condicional, probit multinomial o logit mixto. ¿Es su resultado en cambio una clasificación de alternativas preferidas? Ajuste un modelo probit ordenado por rangos o logit ordenado por rangos. Independientemente del modelo ajustado, puede usar margins para interpretar fácilmente los resultados. Estime cuánto influye la distancia a la universidad más cercana en la probabilidad de matricularse en ella e incluso en la probabilidad de asistir a una escuela técnica.
Análisis bayesiano
Ajuste modelos de regresión bayesianos utilizando uno de los métodos de cadenas de Markov Monte Carlo (MCMC). Puede elegir entre varios modelos compatibles o incluso programar el suyo. Hay herramientas extensas para comprobar la convergencia, incluyendo múltiples cadenas. Calcule estimaciones de la media posterior e intervalos creíbles para parámetros del modelo y funciones de estos parámetros. Puede realizar tanto pruebas de hipótesis basadas en intervalos como en modelos. Compare modelos usando factores de Bayes. Calcule el ajuste del modelo usando valores predictivos posteriores y genere predicciones. Si quiere tener en cuenta la incertidumbre del modelo en su modelo de regresión, use promediado bayesiano de modelos.
Inferencia causal
Estime efectos causales de estilo experimental a partir de datos observacionales. Con los estimadores de efectos de tratamiento de Stata, puede usar un marco de resultados potenciales (contrafactuales) para estimar, por ejemplo, el efecto de la estructura familiar sobre el desarrollo infantil o el efecto del desempleo sobre la ansiedad. Ajuste modelos para resultados continuos, binarios, de conteo, fraccionales y de supervivencia con tratamientos binarios o multivaluados usando ponderación por probabilidad inversa (IPW), emparejamiento por puntaje de propensión, emparejamiento por vecino más cercano, ajuste por regresión o estimadores doblemente robustos. Si la asignación a un tratamiento no es independiente del resultado, puede usar un estimador de efectos de tratamiento endógeno. En presencia de efectos de grupo y tiempo, puede usar estimadores de diferencias en diferencias (DID) y de triple diferencia (DDD). En presencia de covariables de alta dimensión, puede usar lasso. Si los efectos causales están mediados por otra variable, use mediación causal con mediate para distinguir efectos directos e indirectos.
Programación
¿Quiere programar sus propios comandos para realizar estimaciones, gestionar datos o implementar otras funciones nuevas? Stata es programable, y miles de usuarios de Stata han implementado y publicado miles de comandos aportados por la comunidad. Estos comandos se comportan igual que los oficiales de Stata y se instalan fácilmente de forma gratuita a través de Internet desde Stata. Una característica única del entorno de programación de Stata es Mata, un lenguaje rápido y compilado con soporte para tipos de matrices. Por supuesto, tiene todas las operaciones matriciales avanzadas que necesita. También tiene acceso al poder de LAPACK. Además, cuenta con solucionadores y optimizadores integrados para facilitar la implementación de sus propios estimadores de máxima verosimilitud, GMM u otros. Y puede aprovechar todas las funciones de estimación y demás de Stata desde Mata. Muchos de los comandos oficiales de Stata están implementados en Mata.
Informes automatizados y tablas personalizables
Stata está diseñado para investigación reproducible, incluyendo la capacidad de crear documentos dinámicos que incorporen los resultados de su análisis. Cree archivos de Word o PDF, complete hojas de cálculo de Excel con resultados y deles formato a su gusto, y combine Markdown, HTML, resultados de Stata y gráficos de Stata, todo desde Stata. Cree tablas que comparen resultados de regresión o estadísticas resumidas, use estilos predeterminados o aplique los suyos propios, y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown e inclúyalas en sus informes.
Jupyter Notebook con Stata
Jupyter Notebook es ampliamente utilizado por investigadores y científicos para compartir sus ideas y resultados con fines de colaboración e innovación. Es una aplicación web fácil de usar que le permite combinar código, visualizaciones, fórmulas matemáticas, texto narrativo y otros medios enriquecidos en un solo documento (un 'notebook') para computación interactiva y desarrollo. Puede invocar Stata y Mata desde Jupyter Notebook con el kernel IPython (Python interactivo). Esto significa que puede combinar las capacidades de Python y Stata en un solo entorno para que su trabajo sea fácilmente reproducible y compartible con otros.
Características para los investigadores de salud pública
Métodos de encuestas
Ya sea que sus datos requieran un simple ajuste ponderado debido a tasas de muestreo diferenciales o que tenga datos de una encuesta compleja de múltiples etapas, las funciones de encuestas de Stata pueden proporcionarle errores estándar correctos e intervalos de confianza precisos para sus inferencias. Simplemente especifique las características relevantes de su diseño de muestreo, como los pesos de muestreo (incluidos los pesos en múltiples etapas), el agrupamiento (en una, dos o más etapas), la estratificación y la postestratificación. Después de eso, la mayoría de los comandos de estimación de Stata pueden ajustar sus estimaciones para corregir su diseño de muestreo.
Modelos multinivel de efectos mixtos
Ya sea que las agrupaciones en sus datos surjan de manera anidada (pacientes anidados en clínicas y clínicas anidadas en regiones) o de manera no anidada (regiones cruzadas con ocupaciones), puede ajustar un modelo multinivel para tener en cuenta la falta de independencia dentro de estos grupos. Ajuste modelos para resultados continuos, binarios, de conteo, ordinales y de supervivencia. Estime varianzas de interceptos aleatorios y coeficientes aleatorios. Calcule correlaciones intraclase. Prediga efectos aleatorios. Estime relaciones promediadas en la población sobre los efectos aleatorios.
Datos de panel
Aproveche al máximo la información adicional que proporcionan los datos de panel mientras maneja al mismo tiempo las particularidades de los datos de panel. Estudie las características invariantes en el tiempo dentro de cada panel, las relaciones entre paneles y cómo cambian con el tiempo los resultados de interés. Ajuste modelos lineales o no lineales para resultados binarios, de conteo, ordinales, censurados o de supervivencia con estimadores de efectos fijos, efectos aleatorios o promediados en la población. Ajuste modelos dinámicos o modelos con endogeneidad. Ajuste modelos bayesianos de datos de panel.
Modelos de ecuaciones estructurales (SEM)
Estime efectos de mediación, analice la relación entre un concepto latente no observado, como la depresión, y las variables observadas que miden la depresión; modele un sistema con muchas variables endógenas y errores correlacionados; o ajuste un modelo con relaciones complejas entre variables latentes y observadas. Ajuste modelos con resultados continuos, binarios, de conteo, ordinales, fraccionales y de supervivencia. Incluso ajuste modelos multinivel con grupos de observaciones correlacionadas, como niños dentro de las mismas escuelas. Evalúe el ajuste del modelo. Calcule efectos indirectos y totales. Ajuste modelos dibujando un diagrama de ruta o usando una sintaxis de comando sencilla.
Regresiones lineales, binarias y de conteo
Ajuste modelos lineales clásicos de la relación entre un resultado continuo, como el salario, y los determinantes del salario, como el nivel educativo, la edad, la experiencia y el sector económico. Si su respuesta es binaria (por ejemplo, empleado o desempleado), ordinal (nivel educativo) o de conteo (número de hijos), no se preocupe. Stata cuenta con estimadores de máxima verosimilitud—probit, probit ordenado, Poisson y muchos otros—que estiman la relación entre estos resultados y sus determinantes. Una amplia gama de herramientas está disponible para analizar estos modelos. Prediga resultados y sus intervalos de confianza. Pruebe la igualdad de parámetros o cualquier combinación lineal o no lineal de parámetros.
Meta-análisis
Combine resultados de múltiples estudios para estimar un efecto general. Utilice gráficos de bosque para visualizar resultados. Utilice análisis por subgrupos y meta-regresión para explorar la heterogeneidad de los estudios. Use gráficos de embudo y pruebas formales para explorar el sesgo de publicación y los efectos de estudios pequeños. Use análisis de recorte y relleno para evaluar el impacto del sesgo de publicación en los resultados. Realice meta-análisis acumulativos y de exclusión de un estudio a la vez. Realice meta-análisis univariado, multinivel y multivariado. Utilice la suite meta o deje que la interfaz del Panel de control lo guíe en todo su meta-análisis.
Imputación múltiple
Tenga en cuenta los datos faltantes en su muestra utilizando imputación múltiple. Elija entre métodos univariados y multivariados para imputar valores faltantes en variables continuas, censuradas, truncadas, binarias, ordinales, categóricas y de conteo. Luego, en un solo paso, estime parámetros utilizando los conjuntos de datos imputados y combine los resultados. Ajuste un modelo lineal, logit, Poisson, jerárquico, de supervivencia o uno de los muchos otros modelos compatibles. Utilice el comando mi o deje que la interfaz del Panel de control lo guíe a través de todo su análisis de MI.
Predicciones ajustadas, contrastes e interacciones
Las predicciones ajustadas y los contrastes le permiten analizar las relaciones entre su variable de resultado y sus covariables, incluso cuando ese resultado es binario, de conteo, ordinal o categórico. Calcule predicciones ajustadas con covariables fijadas en valores interesantes o representativos. O calcule medias marginales para cada nivel de una covariable categórica. Compare las predicciones ajustadas o las medias marginales usando contrastes. Si tiene datos multinivel o de panel y efectos aleatorios, estos se integran automáticamente para proporcionar estimaciones marginales (es decir, promediadas en la población). Después de ajustar casi cualquier modelo en Stata, analice el efecto de las interacciones entre covariables y cree fácilmente gráficos para visualizarlas.
Análisis de supervivencia
Analice resultados de duración—resultados que miden el tiempo hasta un evento como un fallo o una muerte—utilizando las herramientas especializadas de Stata para análisis de supervivencia. Tenga en cuenta las complicaciones inherentes a los datos de supervivencia, como no observar a veces el evento (censura a la derecha, izquierda o por intervalo), individuos que ingresan al estudio en momentos diferentes (entrada retardada) e individuos que no son observados continuamente a lo largo del estudio (lagunas). Puede estimar y graficar la probabilidad de supervivencia a lo largo del tiempo. O modele la supervivencia como función de covariables utilizando modelos de regresión de Cox, Weibull, lognormal y otros. Prediga razones de riesgo, tiempo medio de supervivencia y probabilidades de supervivencia. ¿Tiene grupos de individuos en su estudio? Ajuste la correlación dentro de los grupos con un modelo de efectos aleatorios o de fragilidad compartida. Si tiene muchas covariables potenciales, utilice lasso cox y elasticnet cox para selección de modelos y predicción.
Inferencia causal
Estime efectos causales de estilo experimental a partir de datos observacionales. Con los estimadores de efectos de tratamiento de Stata, puede usar un marco de resultados potenciales (contrafactuales) para estimar, por ejemplo, el efecto de la estructura familiar sobre el desarrollo infantil o el efecto del desempleo sobre la ansiedad. Ajuste modelos para resultados continuos, binarios, de conteo, fraccionales y de supervivencia con tratamientos binarios o multivaluados usando ponderación por probabilidad inversa (IPW), emparejamiento por puntaje de propensión, emparejamiento por vecino más cercano, ajuste por regresión o estimadores doblemente robustos. Si la asignación a un tratamiento no es independiente del resultado, puede usar un estimador de efectos de tratamiento endógeno. En presencia de efectos de grupo y tiempo, puede usar estimadores de diferencias en diferencias (DID) y de triple diferencia (DDD). En presencia de covariables de alta dimensión, puede usar lasso. Si los efectos causales están mediados por otra variable, use mediación causal con mediate para distinguir efectos directos e indirectos.
Series de tiempo
Maneje los desafíos estadísticos inherentes a los datos de series de tiempo—autocorrelaciones, factores comunes, heterocedasticidad condicional autorregresiva, raíces unitarias, cointegración y mucho más. Analice series temporales univariadas usando ARIMA, ARFIMA, modelos de cambio de régimen de Markov, modelos ARCH y GARCH, y modelos de componentes no observados. Analice series temporales multivariadas usando VAR, VAR estructural, VEC, GARCH multivariado, modelos de factores dinámicos y modelos de espacio de estados. Calcule y grafique respuestas a impulsos. Pruebe la existencia de raíces unitarias. Realice análisis bayesiano de series de tiempo.
TRI (teoría de respuesta al ítem)
Explore la relación entre características latentes no observadas, como la satisfacción hospitalaria, y la probabilidad de responder positivamente a ítems de un cuestionario relacionados con la satisfacción. O explore la relación entre la salud no observada y las respuestas autoinformadas a preguntas sobre movilidad, independencia y otras actividades afectadas por la salud. La TRI puede usarse para crear medidas de tales características no observadas o ubicar a los individuos en una escala que mida la característica. También puede usarse para seleccionar los mejores ítems para medir un rasgo latente. Los modelos TRI están disponibles para ítems de respuesta binaria, graduada, valorada, de crédito parcial y nominal. Visualice las relaciones usando curvas características de ítems y mida el rendimiento global de la prueba usando funciones de información de la prueba.
Informes automatizados y tablas personalizables
Stata está diseñado para investigación reproducible, incluyendo la capacidad de crear documentos dinámicos que incorporen los resultados de su análisis. Cree archivos de Word o PDF, complete hojas de cálculo de Excel con resultados y deles formato a su gusto, y combine Markdown, HTML, resultados de Stata y gráficos de Stata, todo desde Stata. Cree tablas que comparen resultados de regresión o estadísticas resumidas, use estilos predeterminados o aplique los suyos propios, y exporte sus tablas a Word, PDF, HTML, LaTeX, Excel o Markdown e inclúyalas en sus informes.
Jupyter Notebook con Stata
Jupyter Notebook es ampliamente utilizado por investigadores y científicos para compartir sus ideas y resultados con fines de colaboración e innovación. Es una aplicación web fácil de usar que le permite combinar código, visualizaciones, fórmulas matemáticas, texto narrativo y otros medios enriquecidos en un solo documento (un 'notebook') para computación interactiva y desarrollo. Puede invocar Stata y Mata desde Jupyter Notebook con el kernel IPython (Python interactivo). Esto significa que puede combinar las capacidades de Python y Stata en un solo entorno para que su trabajo sea fácilmente reproducible y compartible con otros.
El Boletín
-
-
Cambridge 2025
Causal Machine Learning: Principled Approaches for Econometric Analysis
-
Stata 19 training
Why Timberlake is the ideal Partner to deliver Structured Hands-on Training with Stata 19
-
AI: The Future of Labour Markets
-
Farewell GPT-4.0: Which is the best ChatGPT Model for Econometrics & Data Science Programming?
-
The Green Economy: Can Sustainable Investments Drive Growth?
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Essential
Name | Descripción | Lifetime |
---|---|---|
ADD_TO_CART | (Adobe Commerce only) Used by Google Tag Manager | 1 Year |
GUEST-VIEW | Stores the Order ID that guest shoppers use to retrieve their order status. Guest orders view. Used in Orders and Returns widgets | 1 Year |
LOGIN_REDIRECT | Preserves the destination page that was loading before the customer was directed to log in | 1 Year |
MAGE-BANNERS-CACHE-STORAGE | (Adobe Commerce only) Stores banner content locally to improve performance | 1 Year |
MAGE-MESSAGES | Tracks error messages and other notifications that are shown to the user | 1 Year |
MAGE-TRANSLATION-STORAGE | Stores translated content when requested by the shopper | 1 Year |
MAGE-TRANSLATION-FILE-VERSION | Tracks the version of translations in local storage | 1 Year |
PRODUCT_DATA_STORAGE | Stores configuration for product data related to Recently Viewed/Compared Products | 1 Year |
RECENTLY_COMPARED_PRODUCT | Stores product IDs of recently compared products | 1 Year |
RECENTLY_COMPARED_PRODUCT_PREVIOUS | Stores product IDs of previously compared products for easy navigation | 1 Year |
RECENTLY_VIEWED_PRODUCT | Stores product IDs of recently viewed products for easy navigation | 1 Year |
RECENTLY_VIEWED_PRODUCT_PREVIOUS | Stores product IDs of recently previously viewed products for easy navigation | 1 Year |
REMOVE_FROM_CART | (Adobe Commerce only) Used by Google Tag Manager | 1 Year |
STF | Records the time messages are sent by the SendFriend | 1 Year |
X-MAGENTO-VARY | Configuration setting that improves performance when using Varnish static content caching | 1 Year |
FORM_KEY | A security measure that appends a random string to all form submissions to protect the data from Cross-Site Request Forgery | 1 Year |
MAGE-CACHE-SESSID | The value of this cookie triggers the cleanup of local cache storage | 1 Year |
MAGE-CACHE-STORAGE | Local storage of visitor-specific content that enables ecommerce functions | 1 Year |
MAGE-CACHE-STORAGE-SECTION-INVALIDATION | Forces local storage of specific content sections that should be invalidated | 1 Year |
PERSISTENT_SHOPPING_CART | Stores the key (ID) of persistent cart to make it possible to restore the cart for an anonymous shopper | 1 Year |
PRIVATE_CONTENT_VERSION | Appends a random, unique number and time to pages with customer content to prevent them from being cached on the server | 1 Year |
SECTION_DATA_IDS | Stores customer-specific information related to shopper-initiated actions, such as wish list display and checkout information | 1 Year |
STORE | Tracks the specific store view/locale selected by the shopper | 1 Year |
Marketing
Name | Descripción | Lifetime |
---|---|---|
CUSTOMER_SEGMENT_IDS | Stores your Customer Segment ID | 1 Year |
EXTERNAL_NO_CACHE | A flag that, indicates whether caching is on or off | 1 Year |
FRONTEND | Your session ID on the server | 1 Year |
GUEST-VIEW | Allows guests to edit their orders | 1 Year |
LAST_CATEGORY | The last category you visited | 1 Year |
LAST_PRODUCT | The last product you looked at | 1 Year |
NEWMESSAGE | Indicates whether a new message has been received | 1 Year |
NO_CACHE | Indicates whether it is allowed to use cache | 1 Year |
Functionality
Name | Descripción | Lifetime |
---|---|---|
MG_DNT | Allows you to restrict Adobe Commerce data collection if you have custom code to manage cookie consent on your site | 1 Year |
USER_ALLOWED_SAVE_COOKIE | Used for cookie restriction mode | 1 Year |
AUTHENTICATION_FLAG | Indicates if a shopper has signed in or signed out | 1 Year |
DATASERVICES_CUSTOMER_ID | Indicates if a shopper has signed in or signed out | 1 Year |
DATASERVICES_CUSTOMER_GROUP | Indicates a customer's group. This cookie is stored as sha1 checksum of the customer's group ID | 1 Year |
DATASERVICES_CART_ID | Identifies a shopper's cart actions | 1 Year |
DATASERVICES_PRODUCT_CONTEXT | Identifies a shopper's product interactions. This cookie contains the customer's unique quote ID in the system | 1 Year |
Statistical
Name | Descripción | Lifetime |
---|---|---|
_ga | Used by Google Analytics | 1 Year |
_ga_* | Used by Google Analytics | 1 Year |
Validate your login
Iniciar Sesión
Crear una nueva cuenta