Qué son las dummy variables
- Erick Almache
- 21 Mar
- 4 Min. reading time
Actualizado: 4 ago
Uno de los conceptos clave en las asignaturas de Data Analysis o Econometría de IE University son las variables cualitativas o dummy variables dentro de los modelos de regresión. A continuación lo explicamos con algunas claves.
Table of contents
¿Para qué sirven las variables dummy?
Un ejemplo práctico
How are the coefficients interpreted?
La trampa de las dummy variable
Summary table
¿Para que sirven las variables dummy?
Una variable dummy es aquella que toma un valor entre 1 o 0 para indicar la presencia o ausencia de una condición. Se utiliza sobre todo en análisis estadísticos y modelos de regresión para aportar información categórica.
Ejemplos comunes de variables dummy:
Sexo: por ejemplo, que se tome el valor 1 para los hombres y 0 para las mujeres.
Región geográfica: con el valor 1 para una determinada región geográfica y 0 para otras regiones.
Estado civil: se puede utilizar el valor 1 para los casados y 0 para los solteros.
Presencia o ausencia de una característica: se puede crear una variable dummy que tome el valor 1 si un individuo tiene una determinada característica (por ejemplo, si tiene un móvil) y 0 si no la tiene.
Edad: en este caso se utiliza el valor 1 para una determinada edad (por ejemplo, los mayores de 65 años) y 0 para el resto de edades.
Las variables se incluyen en un modelo de regresión lineal, lo que permite evaluar la relación entre un valor principal y la variable dependiente de interés.
Un ejemplo práctico
Para analizar cómo el nivel de educación afecta al salario de los trabajadores. Se crea una variable dummy para representar si un trabajador tiene un título universitario o no. En este caso, la variable toma el valor 1 si el trabajador tiene un título universitario y 0 si no lo tiene.
Elaboramos un Multiple Linear Regression Model (MLRM), es decir, modelo de regresión con más de una variable, y por tanto se incluye una variable cuantitativa como la experiencia laboral.
Esta sería la fórmula correcta:
Salary = β0 + β1 Education + β2 Experience + ε
Las claves:
El salario es la variable dependiente.
Educación es la variable independiente que toma el valor 1 si el trabajador tiene un título universitario y 0 si no lo tiene.
Experiencia es la variable independiente que representa la trayectoria profesional.
β0, β1, and β2 are the coefficients coefficients regression coefficients that we estimated from the data to fit the multiple linear regression model.
ε is the error term, which represents the variation in wage that is not explained by education and work experience.

How are the coefficients interpreted?
Los coeficientes β1 y β2 se interpretan de la siguiente manera:
β1 representa el cambio en el salario asociado con tener un título, manteniendo constante la experiencia laboral. Si β1 es positivo, se puede asociar un título universitario con tener un salario más alto.
β2 representa el cambio en el salario asociado con cada año adicional de experiencia laboral, manteniendo constante la educación. Si β2 es positivo, se conecta directamente la experiencia laboral con la posibilidad de optar a un salario elevado.
Si β1 y β2 no son estadísticamente significativos, no podemos concluir que haya relación entre la educación, la experiencia y el salario.
La trampa de las dummy variables
It occurs when all of the all possible qualitative variables are included in the model, resulting in perfect collinearity between them. For example, if in the "sex" category we include one variable for male and one for female in the model instead of a single variable that takes the value 1 or 0 depending on whether it belongs to each category.
De esta manera el modelo es inestable y los coeficientes estimados son incorrectos.
Este problema genera multicolinealidad, que es lo que ocurre cuando dos o más variables independientes en un modelo están muy correlacionadas entre sí, lo que complica la capacidad de determinar la contribución única de cada variable a la variable dependiente.
Por lo tanto, se debe eliminar una de las variables cualitativas del modelo.

Summary table
Concept | Examples | Coefficient | Trampa de las dummy variables |
A dummy variable is a variable that takes the value 1 or 0 to indicate the presence or absence of a certain characteristic or condition. |
| The change in the dependent variable associated with meeting the dummy, holding the rest constant
| It occurs when all possible qualitative variables are included in the model, resulting in perfect collinearity between them. |
Para saber más a cerca de las Dummy Variables, consulta la guía escrita por Jeffrey Wooldridge, "Introductory Econometrics: A Modern Approach". Disponible en Amazon a través del siguiente enlace.
If you are interested in learning more about any of these issues in order to improve your performance in your university career in IE UniversityICADE, ICADE, CUNEF, Columbia or any other, or to take part in one of our Executive courses for companiesyou can send us a message.