Saltar ao contido

Lei de Zipf

Na Galipedia, a Wikipedia en galego.

A Lei de Zipf, formulada na década de 1940 por George Kingsley Zipf, lingüista da Universidade Harvard, na súa obra Human Behaviour and the Principle of Least-Effort ("Comportamento Humano e o Principio do Menor Esforzo"), é unha lei empírica que rexe a dimensión, importancia ou frecuencia dos elementos dunha lista ordenada[1][2]. Trátase dunha lei de potencias sobre a distribución de valores de acordo co número da orde nunha lista. Nunha lista, o membro n tería unha relación de valor con respecto ao primeiro membro da lista segundo 1/n. Por exemplo, nunha lingua a frecuencia coa que aparecen as diversas palabras segue unha distribución que se pode aproximar por:

onde Pn representa a frecuencia dunha palabra ordenada na enésima posición e o expoñente a é próximo á unidade. Isto significa que o segundo elemento se repetirá aproximadamente cunha frecuencia que é metade da do primeiro, e o terceiro elemento cunha frecuencia de 1/3 e así sucesivamente. Unha lei non empírica, pero máis precisa, derivada dos traballos de Claude Shannon, foi descuberta por Benoît Mandelbrot.

Os campos de aplicación da lei de Zipf son diversos, e son tamén varias as tendencias de pensamento que a teñen proposto como contrapartida á distribución gausiana no ámbito das ciencias sociais. Na realidade, nas ciencias sociais non se segue sempre unha distribución gaussiana, mais tampouco se segue sempre a lei de Zipf.

Frecuencia das palabras en función da orde na versión orixinal de Ulises de James Joyce.

Zipf analizou a obra monumental de James Joyce, Ulises, e contou as palabras distintas, ordenándoas por frecuencia. Verificouse que:

  • a palabra máis común aparecía 8.000 veces;
  • a décima, 800 veces;
  • a centésima, 80 veces;
  • a milésima, 8 veces.
  1. http://www.pauloliveira.com (ed.). "lei de Zipf" (en portugués). Arquivado dende o orixinal o 03 de decembro de 2010. Consultado o 8 de xaneiro de 2010. 
  2. Laura Cerqueira, Armando Malheiro da Silva (2007). "Uma abordagem infométrica no âmbito da Ciência de Informação a propósito dos dez anos de edição das Páginas a&b" (PDF) (en portugués). Consultado o 8 de xaneiro de 2012. 

Véxase tamén

[editar | editar a fonte]

Ligazóns externas

[editar | editar a fonte]