List of Posts

Visualizing extreme events with ggplot2
5 min

When working with time series, sometimes, it is desired to highlight some events with some particular pattern. For example, highlight periods of time where the variable on interest exceed certain threshold or conversely. With this in mind, I extended an stat of ggplot2 to allow easy visualization of those events.

ggplot2 tidyverse R
Upgrade Debian Wheezy to Debian Jessie
2 min

In this last week, I updated my RStudio in Debian Wheezy and it turned out that it needed a more recent version of the package lib6. A reliable solution was to upgrade my system to Jessie, the current stable distribution of Debian.

LaTeX Linux Matlab Software R
Thesis Template in Latex (UNI)
1 min

Some months ago, I finished my undergraduate thesis and I modified the ClemsonThesis project made by Andrew R. Dalton in order to customize and create the UniThesis.cls class in LaTeX as a template for undergraduate tesis at Universidad Nacional de Ingeniería (UNI).

Ciencia Education LaTeX Scientific Writing Thesis Universidad Nacional de Ingeniería
Coursera Downloader
1 min

For people who really like to take courses in the MOOC Coursera, I strongly recommend to use cousera-dl to download a group of lecture resources (.ppt, .pdf, .mp4). You can download all the available resources or make a filter by section name, lecture name, format, others, However, the installation could be a little hard work for people who are not accostumed to Terminal or console, but it really worths.

Ciencia Education Informática MOOC
Print eps figure with accent in matlab
2 min

Matlab is a powerfull software to plot images in different styles and formats. For this reason, researchers use it to make graphics to their papers. The eps format is one of the best to present it in papers or presentations.

Data Visualization Eps image Informática mapa de lima Matlab Programming
Summary of Cluster Analysis Distances
4 min

Cluster analysis is one of the most useful techniques in research and applications studies in a wide range of branches. It is also consider as a data reduction technique like principal components analysis (PCA), where instead of analyzing the variables, we analyze the profiles or registers.

Clustering
Datos sin estadística
1 min

“Los datos, sin estadística, no son más que ruido y confusión.” “Data, without statistics, it is not more than noise and confusion.”

¿Cómo actualizar Debian 7 Wheezy?
3 min

Debian 7 Wheezy es la última actualización estable de las distribución Debian en Linux. Hasta ahora me ha funcionado perfectamente y es por ello que deseo mostrar algunos pasos y sitios web que me funcionaron perfectamente para su actualización e instalaciones de programas que para mi caso son importantes.

Debian Linux
Probabilidades de la vida
1 min

Este capítulo de Redes para la ciencia nos muestra que las probabilidades están en los sucesos que vivimos día a día. Aunque existen ciertos errores con las probabilidades y los porcentajes presentados, es una manera muy interesante y entretenida de hablar de probabilidades con todo el mundo.

Probabilidades
¿Porqué usar la media armónica?
2 min

Recuerdo cuando llevé la clase de Estadística Descriptiva, y también la de Inferencia Paramétrica, nos presentaron estadísticos descriptivos como el promedio aritmético, geométrico y armónico. En ese instante no tenía ni la mas vaga idea de cuando utilizar el promedio armónico ya que al parecer, no podía interpretar, aquella fórmula, de una manera más comprensible o que de pistas de una interpretación clara tal como lo es el promedio aritmético.

Estadística Descriptivo Estadística Inferencial promedio
Redes para la ciencia: Robots para saber cómo somos
1 min

Otro capítulo maravilloso de Eduard Punset en Redes para la Ciencia: En donde Deb Roy (Ingeniero Informático del MIT) explica como realizó un estudio de investigación grabando a su hijo por 2 años, almacenando 300 Gb por día, para poder entender los factores principales que hacen que un niño aprenda a hablar y así poder implementar esta capacidad a un robot.

Deb Roy Eduard Punset Informática
Mapas en R con RgoogleMaps
1 min

Los mapas con el paquete RgoogleMaps se obtienen descargando los mapas desde Google Maps –valga la redundancia-, lo bueno es la interface gráfica con que se pueden presentar los mapas incluyendo las calles, centros de atracción, etc. Además la sintaxis para obtener el mapa es sencilla y pueden agregar objetos en la ubicación deseada según su latitud y longitud.

mapa de lima Software R
Mapas en el paquete de "Métodos para datos espaciales" (sp) en R
2 min

Para trabajar con este paquete podemos descargar la información georeferenciada de http://gadm.org/ de cualquier país, lo malo es que a mayor nivel de detalle tal como distritos existen discrepancias con la realidad. De todas maneras este paquete resulta interesante y útil a la hora de trabajar con datos georeferenciados y mucho más si son datos propios.

mapa de lima Software R
Teorema del Límite Central
2 min

El siguiente código en el software R nos brinda una forma sencilla para comprobar el teorema del límite central, explícitamente para verificar la distribución muestral de la media muestral. Como puede ver tiene distintas opciones de escoger la distribución, sin necesidad de asumir la normalidad, pero las variables \(x_i\) si deben ser independientes e identicamente distribuidas.

Estadística Inferencial
Redes para la ciencia
1 min

Eduard Punset nació en Barcelona - España, es abogado, economista y comunicador científico. Se preocupa por transmitir el conocimiento científico de diversos aspectos de nuestras vidas a las personas no muy dedicadas a la ciencia ayudandonos a entender diversas situaciones del día a día a través de explicaciones científicas.

Ciencia
Ejemplo inicial de grados de libertad
2 min

Para los estadísticos o ingenieros estadísticos el término de “grados de libertad” es muy conocido, incluso en la mayoría de los libros de estadística y probabilidad es muy utilizado pero no dejan un concepto claro sobre el mismo, siendo uno de los más conocidos “el número de variables menos el número de parámetros a estimar”.

Estadística Inferencial