En mi opinión el ejemplo mostrado, es simple pero a su misma vez fácil de entender, pero debemos recalcar que en la tabla N°2, se menciona al coeficiente de correlación múltiple, la pregunta es ¿cómo se obtuvo este coeficiente de correlación múltiple?. Para demostrar que el coeficiente de correlación múltiple es 0.99, se debió mostrar distintas graficas, con los datos obtenidos experimentalmente, para que de esa manera se pueda obtener el coeficiente de correlación múltiple, este sería el que se aproxima más a la unidad, ya que este coeficiente muestra cuanta relación hay entre las variables explicativas y de respuesta. Asimismo se puede verificar del ejemplo mostrado que el rendimiento aumenta, al aumentar la temperatura (variable explicativa), por otro lado también se puede notar que el pH no interviene en el rendimiento a comparación con la concentración que si se aumenta el rendimiento también aumenta. En conclusión se puede deducir que la ecuación final estará representada por las variables explicativas y sus coeficientes, donde Y será igual a una variable de respuesta, como el rendimiento. Este método se utiliza principalmente para las industrias que generan productos de uso cotidiano (lapiceros, cuadernos, etc) o para usos comestibles, ya que cuando se genera un producto no solo tenemos una variable que interviene sino muchas (temperatura, ambiente, humedad, etc) y el operador debe de evitar que el producto sea menos afectados por estas variables explicativas, para la obtención de un mayor rendimiento. Pascual Chapilliquen, Mildred Mishell
Este método estadístico se utiliza para determinar la contribución de varios factores en un simple evento o resultado, el análisis multivariables tiene muchas ventajas sobre los métodos de regresión tradicionales utilizándose la información de múltiples variables de entrada, aunque éstas no sean linealmente independientes puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes). Mendizabal Meza, Cristian Fernando
El Análisis Multivariables es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariables en el sentido de que hay varias variables medidas para cada individuo ú objeto estudiado.
a diferencia de la regresión lineal simple, donde se analiza la influencia de una sola variable (x)y de otra variable denominada dependiente. En la regresión lineal múltiple se utiliza más de una variable explicativa esto nos ofrece una gran ventaja al utilizar más información en la construcción de un modelo y, consecuentemente realizar mediciones mas precisas. Al tener más de una variable explicativa (no se debe de emplear el término independiente) surgirán algunas diferencias con el modelo de regresión lineal simple. En definitiva, y al igual que en regresión lineal simple, vamos a considerar que los valores de la variable dependiente Y han sido generados por una combinación lineal de los valores de una o más variables explicativas y un término aleatorio: y = b0 +b1 .X1 + b2.X2 + bk.Xk + u
Este tipo de analisis se usa frecuentemente en investigacion ,es cierto que en el analisis de regresion multivariable se utiliza para la prediccion de respuestas a partir de variables explicativas, es posible analizar la relación entre dos o mas variables a traves de ecuaciones, a la que denominamos regresion multivariable. Constantemente en la practica de la investigacion estadistica se encuentran variables que de alguna manera estan relacionadas entre si.
El análisis multivariante mediante técnicas de proyección sobre variables latentes tiene muchas ventajas sobre los métodos de regresión tradicionales:
* se puede utilizar la información de múltiples variables de entrada, aunque éstas no sean linealmente independientes * puede trabajar con matrices que contengan más variables que observaciones * puede trabajar con matrices incompletas, siempre que los valores faltantes estén aleatoriamente distribuidos y no superen un 10% * puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes) pueden separar la información del ruido. Se asume que las X se miden con ruido.
El análisis multivariante mediante técnicas de proyección sobre variables latentes tiene muchas ventajas sobre los métodos de regresión tradicionales:
* se puede utilizar la información de múltiples variables de entrada, aunque éstas no sean linealmente independientes * puede trabajar con matrices que contengan más variables que observaciones * puede trabajar con matrices incompletas, siempre que los valores faltantes estén aleatoriamente distribuidos y no superen un 10% * puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes) pueden separar la información del ruido. Se asume que las X se miden con ruido.
- A manera de síntesis, el trabajo estudiado busca determinar la relación existente entre la variable respuesta: rendimiento de reacción para obtención de ácido bórico; y las variables explicativas: temperatura, concentración y pH. Esto a través del modelo de regresión múltiple y el programa MINITAB para los resultados estadísticos. -Los coeficientes, brindados por MINITAB, señalan la variación de de la variable respuesta (rendimiento de reacción) por aumento unitario de cada variable explicativa (temperatura, concentración y pH). -El coeficiente de determinación (R^2), señala el grado en el que la variación de la variable respuesta, puede ser explicada por las variables explicativas planteadas. En este caso, un 98% de la variación del rendimiento de ácido bórico puede ser explicado por la variación de temperatura, concentración y pH. A pesar de esto, resulta de de mayor interés en un análisis multivariable, saber el R^2 modificado. Este R^2 modificado sí toma en cuenta el tamaño de muestra y el número de variables explicativas implicadas. En este trabajo, el R^2 ajustado, fue de 0,965 señalando que 96,5% de la variación del rendimiento es explicado por variación de la temperatura, concentración y pH. - Aunque no realizado en el trabajo, es importante validar el uso de modelo de regresión multivariable y si es significativo. Para esto, el MINITAB, otorga, en la tabla de análisis de varianza, el cuadro ANOVA, donde el p-valor de la regresión debería ser menor al grado de significancia (<5% usualmente) para afirmar la significancia del uso del modelo de regresión. En este caso, si fue efectivo el uso del modelo (p-valor para regresión: 0,0007). Teniendo así evidencia de que al menos una variable explicativa afecta al rendimiento. -Asimismo, se determinó, individualmente si cada uno de las variables explicadtivas es significativo dentro del modelo. En el presente ejemplo, si fueron significativas, debido a que el p-valor otorgado para cada variable explicativa fue menor a 0,05 (grado de significancia) El modelo de regresión multivariable, es utilizado, por ejemplo, en la industria de bebidas comerciales. Por ejemplo, para determinar y/o predecir la correlación de reducción de CO2, como cantidad de gas perdido en una bebida en particular. Referencia: (1) Kall E., Favarini, T. (2018). Use of multiple regression analysis on the improvement plan in a beverages industry. Engevista. Recuperado de: https://www.researchgate.net/publication/324606665_Use_of_multiple_regression_analysis_on_the_improvement_plan_in_a_beverages_industry
En mi opinión el ejemplo mostrado, es simple pero a su misma vez fácil de entender, pero debemos recalcar que en la tabla N°2, se menciona al coeficiente de correlación múltiple, la pregunta es ¿cómo se obtuvo este coeficiente de correlación múltiple?. Para demostrar que el coeficiente de correlación múltiple es 0.99, se debió mostrar distintas graficas, con los datos obtenidos experimentalmente, para que de esa manera se pueda obtener el coeficiente de correlación múltiple, este sería el que se aproxima más a la unidad, ya que este coeficiente muestra cuanta relación hay entre las variables explicativas y de respuesta. Asimismo se puede verificar del ejemplo mostrado que el rendimiento aumenta, al aumentar la temperatura (variable explicativa), por otro lado también se puede notar que el pH no interviene en el rendimiento a comparación con la concentración que si se aumenta el rendimiento también aumenta. En conclusión se puede deducir que la ecuación final estará representada por las variables explicativas y sus coeficientes, donde Y será igual a una variable de respuesta, como el rendimiento. Este método se utiliza principalmente para las industrias que generan productos de uso cotidiano (lapiceros, cuadernos, etc) o para usos comestibles, ya que cuando se genera un producto no solo tenemos una variable que interviene sino muchas (temperatura, ambiente, humedad, etc) y el operador debe de evitar que el producto sea menos afectados por estas variables explicativas, para la obtención de un mayor rendimiento.
ResponderEliminarPascual Chapilliquen, Mildred Mishell
Este comentario ha sido eliminado por el autor.
ResponderEliminarEste método estadístico se utiliza para determinar la contribución de varios factores en un simple evento o resultado, el análisis multivariables tiene muchas ventajas sobre los métodos de regresión tradicionales utilizándose la información de múltiples variables de entrada, aunque éstas no sean linealmente independientes puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes).
ResponderEliminarMendizabal Meza, Cristian Fernando
El Análisis Multivariables es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariables en el sentido de que hay varias variables medidas para cada individuo ú objeto estudiado.
ResponderEliminara diferencia de la regresión lineal simple, donde se analiza la influencia de una sola variable (x)y de otra variable denominada dependiente. En la regresión lineal múltiple se utiliza más de una variable explicativa esto nos ofrece una gran ventaja al utilizar más información en la construcción de un modelo y, consecuentemente realizar mediciones mas precisas. Al tener más de una variable explicativa (no se debe de emplear el término independiente) surgirán algunas diferencias con el modelo de regresión lineal simple. En definitiva, y al igual que en regresión lineal simple, vamos a considerar que los valores de la variable dependiente Y han sido generados por una combinación lineal de los valores de una o más variables explicativas y un término aleatorio: y = b0 +b1 .X1 + b2.X2 + bk.Xk + u
ResponderEliminarEste tipo de analisis se usa frecuentemente en investigacion ,es cierto que en el analisis de regresion multivariable se utiliza para la prediccion de respuestas a partir de variables explicativas, es posible analizar la relación entre dos o mas variables a traves de ecuaciones, a la que denominamos regresion multivariable. Constantemente en la practica de la investigacion estadistica se encuentran variables que de alguna manera estan relacionadas entre si.
ResponderEliminarEste comentario ha sido eliminado por el autor.
ResponderEliminarEl análisis multivariante mediante técnicas de proyección sobre variables latentes tiene muchas ventajas sobre los métodos de regresión tradicionales:
ResponderEliminar* se puede utilizar la información de múltiples variables de entrada, aunque éstas no sean linealmente independientes
* puede trabajar con matrices que contengan más variables que observaciones
* puede trabajar con matrices incompletas, siempre que los valores faltantes estén aleatoriamente distribuidos y no superen un 10%
* puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes) pueden separar la información del ruido. Se asume que las X se miden con ruido.
El análisis multivariante mediante técnicas de proyección sobre variables latentes tiene muchas ventajas sobre los métodos de regresión tradicionales:
ResponderEliminar* se puede utilizar la información de múltiples variables de entrada, aunque éstas no sean linealmente independientes
* puede trabajar con matrices que contengan más variables que observaciones
* puede trabajar con matrices incompletas, siempre que los valores faltantes estén aleatoriamente distribuidos y no superen un 10%
* puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes) pueden separar la información del ruido. Se asume que las X se miden con ruido.
Este comentario ha sido eliminado por el autor.
ResponderEliminar- A manera de síntesis, el trabajo estudiado busca determinar la relación existente entre la variable respuesta: rendimiento de reacción para obtención de ácido bórico; y las variables explicativas: temperatura, concentración y pH. Esto a través del modelo de regresión múltiple y el programa MINITAB para los resultados estadísticos.
ResponderEliminar-Los coeficientes, brindados por MINITAB, señalan la variación de de la variable respuesta (rendimiento de reacción) por aumento unitario de cada variable explicativa (temperatura, concentración y pH).
-El coeficiente de determinación (R^2), señala el grado en el que la variación de la variable respuesta, puede ser explicada por las variables explicativas planteadas. En este caso, un 98% de la variación del rendimiento de ácido bórico puede ser explicado por la variación de temperatura, concentración y pH. A pesar de esto, resulta de de mayor interés en un análisis multivariable, saber el R^2 modificado. Este R^2 modificado sí toma en cuenta el tamaño de muestra y el número de variables explicativas implicadas. En este trabajo, el R^2 ajustado, fue de 0,965 señalando que 96,5% de la variación del rendimiento es explicado por variación de la temperatura, concentración y pH.
- Aunque no realizado en el trabajo, es importante validar el uso de modelo de regresión multivariable y si es significativo. Para esto, el MINITAB, otorga, en la tabla de análisis de varianza, el cuadro ANOVA, donde el p-valor de la regresión debería ser menor al grado de significancia (<5% usualmente) para afirmar la significancia del uso del modelo de regresión. En este caso, si fue efectivo el uso del modelo (p-valor para regresión: 0,0007). Teniendo así evidencia de que al menos una variable explicativa afecta al rendimiento.
-Asimismo, se determinó, individualmente si cada uno de las variables
explicadtivas es significativo dentro del modelo. En el presente ejemplo, si fueron significativas, debido a que el p-valor otorgado para cada variable explicativa fue menor a 0,05 (grado de significancia)
El modelo de regresión multivariable, es utilizado, por ejemplo, en la industria de bebidas comerciales. Por ejemplo, para determinar y/o predecir la correlación de reducción de CO2, como cantidad de gas perdido en una bebida en particular.
Referencia:
(1) Kall E., Favarini, T. (2018). Use of multiple regression analysis on the improvement plan in a beverages industry. Engevista. Recuperado de: https://www.researchgate.net/publication/324606665_Use_of_multiple_regression_analysis_on_the_improvement_plan_in_a_beverages_industry