Rev. Acad. Canar. Cienc., XIV (Núms. 1-2), 47-64 (2002)
ESTIMACIÓN NO PARAMÉTRICA DEL NÚMERO DE ESPECIES
EN UN ECOSISTEMA DE TAMAÑO DESCONOCIDO VÍA
ESTIMADORES JACKKNIFE GENERALIZADOS EN
POBLACIONES FINITAS
Resumen
Juan José Prieto Martínez
Dpto. de Estadística e Investigación Operativa.
Fac. de C.C. Matemáticas. Universidad Complutense de Madrid.
e-mail: jjprieto@mat.ucm.es
En este artículo se presenta una colección de estimadores no paramétricos para el
número S de especies en un ecosistema de tamaño N conocido, al aplicar una extensión
del jackknife generalizado de Gray y Shucany (1972). Cuando N es desconocido, se
presenta una cota basada en la información dada por la variable aleatoria número de
especies observadas y las variables número de especies observadas una y dos veces. Su
distribución asintótica sirve de vía para la obtención de un estimador, Ñ, para N. El
citado estimador es utilizado para estimar posteriormente S. La realización de los
estimadores S y Ñ son investigados por simulación de Monte Cario.
Palabras claves: Número de especies, jackknife generalizado, distribución
asintótica.
Clasificación AMS: 1162G05
Abstract
We use an extension of the generalized jackknifed approach of Gray and Shucany
(1972) to obtain new nonparametric estimators for the number S of species in a
ecosytem of size N known. If N is unknown it shows an estimator. A limit law is
rigurously proved for it and an estimator is proposed vía the asymptotic distribution.
This estimator is just used to estímate N and can be applied later to the estimators for S.
47
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
The performance of the estimators is investigated by means of Monte Carlo
experiments.
Key words: Number of species, jackknife generalized, asymptotic distribution.
l. Introducción
La estimación del número de clusters de una población presenta un interés relevante en
el campo de la ecología. En este último, las distintas especies que comparten un cierto
hábitat conformarían los clusters y su número se decanta en el índice más significativo a
la hora de evaluar la diversidad del ecosistema o hábitat citado. Por lo general, la
estimación del número de especies se lleva a cabo mediante métodos de capturarecaptura,
siendo la referencia clásica esencial sobre el tema Seber (1982). Una revisión
histórica de los principales trabajos al respecto indica que, al menos en sus orígenes, la
mayoría asumen la hipótesis de que las probabilidades de captura son iguales para todas
las especies de la población. La citada hipótesis es, sin duda, muy cuestionable,
buscando tan solo una cierta manejabilidad en la búsqueda de resultados. Muchos
trabajos pioneros utilizaron la citada hipótesis (Crowcroft y Jeffers (1961 ), Huber
(1962), Edwards & Eberhardt (1967), Bailey (1969), Carothers (1973), Esty (1983) y
Chao (1992)) y probaron empíricamente que no se sostenía en la realidad.
Posteriormente, otros autores mostraron que los sesgos derivados de la heterogeneidad
en las probabilidades de captura podrían ser muy elevados, comprobándose así la
infactibilidad de los resultados obtenidos a través de la utilización de los estimadores
citados. Por ejemplo, Manly (1971), Carothers (1973) y Burnham y Overton (1979)
llegan a evaluar la magnitud del citado sesgo en determinados casos prácticos, llegando
a proponer, tras observar su elevada cuantía, estimadores alternativos mediante la
ampliación de técnicas como la del jackknife generalizado o la de Jolly-Seber. Hoy día,
la utilización de este último tipo de estimadores que relajan la condición de
equiprobabilidad de captura se han extendido enormemente. Pese a ello, una buena parte
de los estimadores más populares exigen el conocimiento del tamaño poblacional global
N que influye a todas las especies y han sido desarrollados mediante las técnicas del
jackknife generalizado.
48
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
En el epígrafe 2 se proponen una colección de estimadores para el número de especies
en poblaciones finitas de tamaño N (conocido) aplicando la técnica de remuestreo
jackknife generalizado. El fin de la citada colección de estimadores es utilizarlos
también cuando el tamaño poblacional es desconocido tras la utilización del estimador
propuesto en Prieto (2001), presentado aquí en el epígrafe 3, para estimar N Es por
consiguiente una estimación en dos etapas. Nótese que, por ejemplo, en entornos
ecológicos parece natural que no se conozca cuál es el tamaño total de la población si el
objetivo es estimar el número de especies que constituye dicha población.
2. Una colección de estimadores para el número de especies
en un ecosistema de tamaño conocido
Supongamos que una población de tamaño conocido N está constituida por S especies o
clusters C1,C2, ... Cs. Definamos 1j el tamaño de la especie C1 donde N=I,¡Tj. Es claro que
N N
S=IF¡ y N= LiF¡,
i=I i=I
donde F; es el número de especies de tamaño i en la población. Finalmente N; denota el
número de especies representadas exactamente i veces en una muestra de tamaño n y Dn
el número total de especies observadas en ella, se tiene que
"
D,,=IN¡
i=I
y
n
n= LiN;.
i=I
En entornos ecológicos la mayoría de los estimadores empleados utilizan la técnica del
jackknife generalizado (j.g.) para construir estimadores (cuasi)insesgados a partir de
otros que no lo son. Los estimadores finales j.g. adoptan la forma (véase Gray y
Shucany (1972))
donde s, y S2 son dos estimadores sesgados para S y Rf.J es un valor real. Este último
valor de R queda abierto con el objetivo de que pueda elegirse convenientemente de
modo que se minimice el sesgo de G. La idea es pues obtener un estimador insesgado
(sofisticado) a partir de otros dos sencillos fácilmente obtenibles por experimentos de
captura-recaptura. Los más habituales por sencillez sonS, = D,, (número de especies
observadas en la muestra) y
49
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
- 1 n
S2 =-LDn_¡(j},
n J=l
donde Dn-10) representa el número de especies observadas en la muestra tras haber
eliminado laj-ésima observación en la misma. Es claro que Dn-1ú)=Dn-l si la especie
asociada a la j-ésima observación ha sido observada una sola vez. En caso contrario,
Dn-10)=Dn. Por consiguiente,
. N¡
Dn_1(;) = D,, --,
n
donde N1 es el número de especies observadas exactamente una vez. Es fácil comprobar
que eligiendo
R = E(D,,)-S
E( Dr,,-1) )-S
conseguimos que G(D,,,Drn-1)) sea insesgado para S. En lo que sigue se utilizará la
notación S =G(D11 ,Dr11-J)). Claramente
siendo
- D,, -RDrn-IJ N1 S= =D,,+Z-,
1-R n
Z=-R-= __E_ (_D~n)_-_S_ _
1-R E(Dr11-J))-E(D11 )
Puesto que X¡ representa el número de observaciones de C1 , se tiene que
E(D,,) = E[tl(X1 >0))= tP(X1 > 0)=S-tP(X1 =0),
donde !(A) es la función indicadora, y
de donde
s
E(N¡)= LP(Xj =l),
j=l
s
LP(Xj =0)
)=/ Z=n"'-s----
LP(X1=1)
) =/
[1]
[2]
Basándonos en una aproximación propuesta por Shlosser (1981) (igualmente utilizada y
justificada en Haas y Stokes (1996)) según la cual
50
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
P(X1 =kJ·{? Jlo-qlrk, 09'91, 1$-SS,
donde q=n/N, y sustituyendo la expresión anterior en [2] se llega a que
s
''f/1-qlj
z,,,n_s_ J=_l ___
L TJq(J- q lrl
)=/
[3]
[4]
Los valores T¡ son desconocidos como es lógico. Aproximando cada uno de ellos por el
promedio
- 1 s N
T=-'LT =-
S J=I 1 S
nS(J -q)
se llega a z "" .
Nq
·De este modo, [1] se puede expresar como
S. =D nS(J-q)N1 =D S(J-q)N1
n+ n+ ·
Nq n n
Finalmente, reemplazando S por s en el segundo miembro de la igualdad y despejando
se llega al estimador:
S =(l-(J-q)N¡)-1n 1 n n
[5]
Un razonamiento similar permite llegar a justificar los distintos estimadores del número
de especies utilizados hoy en día con mayor asiduidad en ecología (aparte del anterior
[5]). A continuación describiremos tres de ellos que tienen una relevancia especial. El
primero parte del valor óptimo de Z dado en [2] y reescribe [1] mediante
s
LP(X1 =0)
S. =D J=I N¡
11 + .
E(N1 / n) n
Identificando E(N1) como el valor observado de esta variable y haciendo uso de [4] se
llega a
s
S = D " T 11 +L. ( 1- q) j
)=/
51
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
en donde, de nuevo, el sumatorio de la derecha no puede ser evaluado. Finalmente,
sustituyendo 'Fj por su valor promedio T = N ! s se llega a
s =DIJ +S(J-q)NIS
que conduce directamente al M-estimador
A L N I S Si =cerofi{l-(1-q) )-DIJ
s
[6]
tras razonar como en s 1 .
El siguiente estimador que comentamos es del tipo jackknife de segundo orden.
Utilizando en [5] las expansiones de Taylor siguientes (pivotando en T)
T - f -
(1-q) j ""(1-q/ +(1-q) ln(J-q)(Tr T ), [7]
Tjq(J-q/r 1 ""Tjq{(J-q/- 1 +(J-q/-1 ln(J - q)(Tj -T)}, "i/j e { l , .. .,S}, [8]
se llega a
1 - i Z"" S(J-q) _ ""S(J-q)(l-ln(J-q)Ty ),
l+ln(J-q)Tyi
[9]
siendo y el coeficiente de variación de los tamaños de las distintas especies que
componen la población. Sustituyendo [9] en [1] se llega a la expresión
A - i N1
S =DIJ +S(J-q)(J-ln(J-q)Ty )-=
n
SN1(1-q) N1(1-q)ln(J-q)yi
= DIJ+ --'-'-----''-'- [10)
n q
de la cual, actuando como en S1 y Si, se deriva el nuevo M-estimador
S• _ {( N1(1-q)J · N¡(l-q)ln(J-q)y i} 3 -cero 1 S-DIJ + .
s n q
[11]
Un enfoque alternativo en la búsqueda de estimadores del número de especies cuando N
es conocido consiste en estimar Z en [1] mediante la técnica de Horvitz-Thompson
(véase Sarndal, Swensson y Wretman (1992)). Para ello obsérvese que Z adopta la
forma z;:::;AJB, siendo A y B sumas no observables pero que pueden ser evaluadas ambas
(o al menos una de ellas) mediante estimadores Horvitz-Thompson. Esto conduce a
proponer estimadores del tipo
52
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
. A N¡
S=Dn +-;;--.
B n
[12)
s
Denotando por f(z)=(l-qf y g(z)=n-1zq(l-qf1, es claro que A= L,J(T1) y
J=l
s
B = L g(T1 ). Tan solo nos referiremos a la variante más utilizada como botón de
j=l
muestra. Estimando B por Horvitz-Thompson se llega a que
BHT = L - g(T1J_ = L g(Tj) T'
{j:X;>O}I P(X1-0) UX;>OJl-(1-q)J
que puede ser aproximado por
• " g(~)
BHT = ¿ ·
{j:X;>O} J-(1-q/1
Aunque A podría ser estimada por esta misma técnica, la citada variante, hoy
ampliamente usada, simplemente estima A mediante la expresión ya usada
anteriormente A= S(J-q )N 1 s. La sustitución de los anteriores valores A y Í3 en [12)
• S(J- )NIS N
nos lleva a S = D" + . q 1 , de donde se deriva el M-estimador
BHT n
• ¡.[ N¡{l-q) NIS))
S 4 =cero S 1- . -Dn .
S nBHT
[13)
Todos los estimadores presentados en este apartado han sido propuestos para estimar el
número de clusters en una población finita de tamaño N conocido. Nuestro interés se
centrará en cómo poder adecuar aquéllos cuando el tamaño poblacional N es
desconocido. En entornos ecológicos es dificil pensar en situaciones en las que
desconociendo S se conozca N Por consiguiente la adecuación antes citada presenta un
interés innegable. Nuestra propuesta consiste en incorporar los tamaños estimados,
utilizando los resultados asintóticos presentados en Prieto ( 1998,2001 ), en lugar del
tamaño poblacional real que figura en todos los estimadores citados en este epígrafe.
Consiste por tanto en una técnica de estimación en dos etapas.
53
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
3. Estimación del tamaño total de un ecosistema.
El estimador citado Ñ (ver Prieto (2001)) no solamente es candidato para estimar el
número de especies S sino que también lo es para estimar el tamaño poblacional N. A
continuación se propone una técnica de estimación para S con N desconocido en dos
etapas: la primera etapa consiste en estimar N a partir del estimador citado Ñ ; en la
segunda etapa se aplican directamente los estimadores propuestos del epígrafe anterior.
Es claro que la estimación de N en la primera etapa simplemente requiere considerar
cada individuo de la población como un clase.
Se asume que una muestra aleatoria de tamaño n con reemplazamiento ha sido extraída
de la población constituida por K individuos. En cada extracción, la probabilidad de
K
observar el individuo j será p1 ~O, con LPJ =l. Sea x1 la variable aleatoria número de
J=l
veces que es observado el individuo j. Por consiguiente ( X 1 ,. .. ,X K) se distribuye como
K
una multinomial M(n;p1,. . .,PK). Para i=O,J, ... ,n, denotemos por N; = Ll(X1 =i) el
J=l
número de individuos que han sido observados exactamente i veces en la muestra. Un
K
estimador natural-sesgado y que infraestima N es el número K ohs = L 1 (X J >o). El
J=l
número N; de clusters observados exactamente i veces cumple que
E(N;)= ±(n)pj(l-pJ'-;.
J=l 1
La desigualdad de Schwartz permite escribir
que es equivalente a[± p1(J-p1 )"-1 )
2[f pj(l-pJ•-2 )-
1
$; f o-p1 )".
j=l j=l j=l
Utilizando [14], esta última desigualdad se convierte en
E(No)~ (E(N1 ))2(n-1)
2nE(N2 )
[14]
[15]
Por otra parte, es claro que N=Kobs+No de donde, tomando esperanzas y teniendo en
cuenta la expresión [15], se deriva que una cota inferior para N es
54
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
C -E K +n-1 E(N1 )2
S - { obs) 2;; E( N 2 )
Esta cota será tanto más precisa (pudiendo llegar a convertirse la desigualdad en
igualdad) cuanto más accesible sea la citada cota de Schwartz, por ejemplo, para el caso
de probabilidades iguales o moderadamente desiguales. Supongamos, por un momento,
que E(Ni) sea conocida. Si así fuera, sustituyendo las restantes esperanzas por sus
respectivos valores observados se obtendría un estimador para Cs dado por
• n-1 nf
C s =K +---·-- obs 2n E(N2)
Por lo general, E(N2) no será conocida. En consecuencia, la expresión anterior no sería
un estimador en sentido estricto porque su valor quedará indeterminado tras observar la
muestra. En cualquier caso, mantendremos la condición de que la citada esperanza es
conocida a la espera de relajar esta limitación en resultados numéricos.
El siguiente teorema indica cuál es la distribución asintótica del valor é s, la cual sirve
como vía para la obtención del estimador citado Ñ .
Teorema. Bajo políticas de muestreo n=n(K)-+oo cuando K-+oo, si las dos siguientes
condiciones técnicas se cumplen: i) n=o(K) y n -1 =o( K -112 ); ii) n · max( p J) = o(J),
..¡;;(és -Cs) entonces converge en distribución a una normal estándar, donde el viene
.fia2
dado por
n-1 E(N1 ) con A1 =-l ,A2 =-----.
n E(N2 )
De aquí se deduce que un estimador para K es:
•
· nVar(ésJ
N= 2 , [16]
s
donde
55
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
+2( n:l)(:J r xe- 2' dG(x)-
-{ Í~dG(xJ }-
1
{ f xe-xdc(xJ+( n:1x :; J f x(x-1;e-x dG(xJr
En la fórmula [16] la estimación de Var(és) queda libre. Existen para su elección
distintas posibilidades. Por ejemplo, a partir de una muestra observada, se podría
estimar mediante técnicas habituales de partición en grupos aleatorios, semimuestras
reiteradas, ... (véase, por ejemplo, Efron (1982) y Wolter (1990)). En entornos ecológicos
(e.g., estimación del número de especies en una población), su mera observación
reiterada conduciría a obtener varias muestras (digamos m ) a partir de las cuales la
varianza empírica de los valores és observados en laj-ésima muestra conduciría a la
estimación empírica habitual mediante
- - 1 m '2 ( 1 m - Jl
Var(Cs) =-ICsh- -Icsh
m h=I m h=I
[17]
Ver Prieto (2001). Esta expresión será utilizada en los resultados numéricos mostrados
en el siguiente epígrafe concernientes al numerador del estimador propuesto en [16].
Queda por determinar el cálculo integral del denominador, que puede siempre ser
aproximado por métodos de cuadraturas. Ñ resulta ser un estimador basado en m
muestras. Cada muestra j proporciona un valor observado é s < K y el conjunto de los m
valores intervienen en la obtención de su varianza estimada. Una característica
importante a subrayar del estimador Ñ es que el resultado asintótico sirve de vía para
obtener el estimador propuesto y exige que n sea una o(K'3) con 1h</J<l . Por otra parte,
la necesidad de no tener que imponer la asunción de equiprobabilidad y considerar que
las p1 's toman valores cercanos a cero en todos los casos puede modelizar una situación
inicial de investigación bastante frecuente en contextos de sobreestimación. Por
consiguiente, el estimador propuesto puede ser aplicado a distintas áreas bajo este
contexto citado.
Una característica que diferencia [16] de otros estimadores es que no involucra
parámetro alguno. Se trata, por tanto, de un estimador de tipo no paramétrico. De facto,
resulta ser también libre de distribución puesto que no exige el conocimiento
distribucional de ninguna de las variables aleatorias que intervienen en el desarrollo. A
56
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
continuación se presentan los resultados numéricos obtenidos por simulación de Monte
Cario para comprobar la eficiencia del estimador propuesto bajo distintos escenarios de
trabajo.
Nótese que para evaluar la varianza es necesario asumir que K es suficientemente
grande y que las probabilidades p1, . .. ,pK han sido generadas de la forma siguiente. A
partir de una distribución dada positiva y admitiendo esperanzas, se extrae una muestra
aleatoria simple (l;¡,. .. ,l;¡J, aceptando que las p¡'s se corresponden con las partes
fraccionales de las i;¡'s es decir, p1 = } 1 . La distribución de Dirichlet es un claro
¿;j
j=I
candidato a modelizar el comportamiento estocástico en la generación conjunta de
p¡,. .. ,pK como proceso. Claramente Pr-+O c.s. cuando K---+oo, siendo estas últimas
convergencias compatibles con las condiciones del teorema. Ello indica que las Pi 's
tienden a ser incorreladas cuando K---+oo. Adicionalmente, las Pi 's pueden considerarse
igualmente distribuidas por simetría. Puesto que en el teorema se exige que npi---+O,
puede comprobarse que esta condición se satisface c.s. por el proceso de generación
citado. Siendo así, aceptamos que F (en realidad F=Fn) es la distribución
( cuasi)subyacente de las np1' de donde, las siguientes aproximaciones directamente se
desprenden del teorema de Kolmogorov-Smimov:
b) _.!.._ [± np Je -np¡ )2 ""_(!_x' _e-_dxF _(_x) J_2
nK J=I i~dF(x)
Si las Pi 's se rigen por un proceso de Dirichlet, es obvio que F debería igualarse con una
Beta reescalada por el tamaño muestra!.
4. Resultados numéricos.
La Tabla 4 presentada a continuación muestran los resultados computacionales que se
han obtenido por simulación de Monte Cario para los M-estimadores S;, i = I,2,3,4. Se
han considerado poblaciones de tamaños N=l0.000 y N=26.000 con un número real de
57
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
especies son desiguales, las cuales están reflejadas en la Tabla 1. Las fracciones de
muestreo consideradas han sido del 10% y 20%.
Tabla l. Estructura de un ecosistema en el caso no equiprobable.
Clusters 11 Probabilidades . JI Nº de indivi~uos :
P1 Por especie. :
- --·
Del cluster 1 al 50 11 0,004 JI 40
- ;
;
Del cluster 51 al 100. 11 0,002 11 20
Del cluster 1O1 al 150. 11 0,008 ¡r-· 80
L!?!~~~ster_ _ !_?_!~3_00 ~---J L.. .... ___ g_,g_~~ ____ J [_ ____ 60
···-·-····--· ··-·· ·--.. ... ..l
El estimador N se ha utilizado ahora para estimar N y los valores estimados sustituyen a
N en las fórmulas de los M-estimadores citados. Puesto que el primero exige la
observación reiterada de varias muestras para llevar a cabo las estimaciones empíricas
de la varianza, hemos fijado el número de las muestras reiteradas en 1 OO. Las Tablas 2 y
3 muestran sucintamente los sesgos y errores cuadráticos medios de N en los casos
equiprobable y no equiprobable, respectivamente.
Tabla 2. Estimación de N. Caso equiprobable. CJCJI E(KPrietoJ Sesgo( K Prieto) ECM
1
[TO]OO] ¡ 1000 11 9680 -320 103625 J
fTo.ooo 1["260{f]¡9760 -240 59449]
[T6.00!j j 2600 11 25060 -940 884825 J
j 26.000 11 5200 11 26780 780 609129 [
Tabla 3. Estimación del número N. Caso no equiprobable. Ci JCi JIE-{- K Prieto ) Sesgo( K Prieto) ECM 1
: 10.0001 1100011 9286 :.714 5107961
r 10.065J[WOOJI 10344 344
·-
119231 1
i 26.000 ll 260011 27122 1122 1260253]
1 26.000 1 i 5200 11 25060 -940 88512!]
58
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
La Tabla 4 incorpora la eficiencia empírica de los M-estimadores S;, con i=l,2,3,4, en
términos de los valores de los sesgos y errores cuadráticos medios. Se intenta comparar
su precisión bajo situaciones análogas. Adicionalmente se intenta contrastar la
sensibilidad de los citados estimadores en los distintos escenarios contemplados en las
tablas. En particular, ante los elementos claves siguientes:
(1) Tamaño de la población N;
(2) Fracción de muestreo;
(3) Estimador Ñ utilizado como sustituto el valor real Nen las fórmulas [3], [6], [11]
y [13].
A raíz de los resultados se contempla, en el mejor de los casos para N=J0.000, que el
error relativo en término de sesgo del s3 es del 7,5% frente a un 12,5% para S.¡. Para
N=26.000, los sesgos relativos de todos los S; tienden a aumentar. S3 es el que
mantiene el sesgo relativo más bajo. La influencia deÑ es pequeña debido a que el
número de especies en la población es muy elevado, estando acorde con las hipótesis de
los resultados asintóticos en los que el estimador está basado. Con respecto a la fracción
de muestreo las precisiones aumentan a medida que el tamaño muestra! aumenta tal
como cabría esperar. En el caso no equiprobable se han obtenido valores de sesgo
similares para todos los M-estimadores. Para n=2000 y N=J0.000 el error relativo en
cuanto a sesgo y perteneciente al mejor de los casos es de un 7%, el cual corresponde a
S3 , frente a un 13% que pertenece a S2 . Puede observarse al respecto que los sesgos
relativos aumentan con respecto al caso equiprobable. En ambos, la influencia del
estimador de la primera etapa Ñ es mínima.
59
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
Tabla 4. Estimación del número de especies en una población.
·- " -·-~-· -· .
1 Estimador S1 e= Caso equiprobable Caso no equiprobable - -¡
001 ECM I! E(S1 ) Sesgo(S1) ECM j
1 10.000 11 10001 1~ ~==~===1=::50===4~lif59 -41 2112 ¡
[lü.00011200011 658]¡ 172 -28 12121
[2MOOJ I 260011 2859 Ir 135 -65 5039 I
[26:0001! 5200 li 1692 I! 150 -5o 3121 1 r·· ··-·--·· .. ·--·-·--···--·-······--··- - ·----- -----·--·-· -- -··-····--· -·. ····--·-··---·-·-···--· -·-----·.. ¡
[ Estimador S 2 _
Caso equiprobable Caso no equiprobable 1
0[~---· ¡ ¡ i(S;; .. --s~~;;¡;:s;·;··-· ¡;¿:ú¡ ¡· irs2.J ..... §~~~~(§~-) ic~ .. I
[fiDíWJ I 1000 IQ 68 -32 1568 Ji 16i -39 1955 1
[TQOOO]J 2000 llf79 -21 9or-·11 110 · -3o 1304 1
j 26.000 ll 260011 152 -48 2917 j: 139 -61 4077 1
,[.2. .6..:.0..0..0..1..1. 5_2__0_0__1_ 1- -1--6-2- ......... -- ..-. 38 1881 li 149 -51 3013 1 -- E;;;~ad;~s~ .. ... .. ... - ... ]
Caso equiprobable Caso no equiprobable I 0 r... . ~ .. - l l i(s;; --:s~;;;¡s~·; ·---ECM ..., i E{S3} s~;;;;s;) .... ECM ·¡
! 10.00011100011 172 -28 1703" 164 -36 1698 1
[TifOOOJI 2000 li 185 -15 109111 177 -23 1105 1
[2MOOJ [ 2600J ¡ 158 -42 2723 ]¡ 145.. .... -55 3717 1
[26:000J~íf67 -33 1989 lf 165 -35 179!]
j Estimador S.¡ j
I Caso equiprobable Caso no equiprobable"""J 001 E(S4 ) Sesgo(S.¡) ECM j! E(S.¡) Sesgo(S.¡) ECM j
ITO:ü<fü]I 100011 167 -33 2003 11 159 -41 2199 J
[TifOOOJI 200011 115 -25 152011 110 -3o 1319 1
¡ 26.0001126001! 150 -5o 3581 1i 157 -5o 5311 1
126.o-óo 1~ 1 162 -3if --------- i8Ii w ·· 15a··------·-·::43 .. -- .. ·-· 24n··1
Las Figuras 1 y 2 muestran gráficamente las densidades empíricas y los diagrama de
caja asociados de los estimadoresS;(i=l,2,3,4) en los casos equiprobables y no
equiprobables cuando N es estimado previamente mediante Ñ . Puede observarse que
son asimétricas y centradas en valores inferiores a 200 aunque con sesgos reducidos.
Es importante subrayar que los resultados empíricos obtenidos han sido comparados
con otros estimadores propuestos por Goodman (1949), Korwar (1988) y Chao y
Lee (1992). Los resultados aquí presentados son muy satisfactorios, sobre todo en el
caso no equiprobable, frente a los obtenidos por los citados autores.
60
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
O\
Figura t. Densidades empíricas y diagramas de caja de los M-estimadores. Caso equiprobable.
~I :::zs: 1 1: :: ::3f: ::::: 1
1:.0 uso no 110 l 'llD 100 110 110
a) Caso equiprobable. Estimación de SI. S=200. N=J0.000. n=l.000.
~I :zs:11:::: ::; ;;;;i::::: ;;;;;: ::: 1 "º '"' "º "º l&O "º llD '"' "º
b) Caso equiprobable. Estimación de Sl. S=200. N=J0.000. n=l.000.
"º '"' llO '"' 100
c) Caso equiprobable. Estimación de S3. S=200. N=J0.000. n=l.000.
~1=z;:. 11 u :· 1: :: : 1 1:.0 160 110 llO p;:o 1C:O 110 110
100 "º "º
d) Caso equiprobable. Estimación de S4. S=200.N=IO.OOO. n=l.000
14
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
O\
N
Figura 2. Densidades empíricas y diagramas de caja de los M-estimadores. Caso no equiprobable.
~O& t=T~~~.,.....,~~~~~~~~~~.,.....,~~~~~~~~~::::i
~ru
~04
~IXJ
~O'!
~DI
~O&
~ru
~04
~IXJ
~O'!
~DI
D
llD
llD
~ru
~04
~IXJ
~O'!
~DI
D
llD
l&O
l&O
l&O
11D llD lllD l!D llD HD
llD l&O 17D IW lllD l!D
a) Caso no equiprobable. Estimación de SI con N. S=200. N=J0.000. n=2.000.
1 l l l 1
110 llD lllD l!D llD ''° llD l&O 17D llD lllD llD
b) Caso no equiprobable. Estimación de S2 con N. S=200. N=J0.000. n=2.000.
1 + H 1
17D llD lllD l!D llD ''° llD l&O 17D llO lllD l!D
c) Caso no equiprobable. Estimación de SJ con N. S=200. N=J0.000. n=2.000.
llD ''°
llD HD
llD ''°
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
4. Bibliografía.
[1] BAILEY, J. A. 1969. "Trap responses ofwild cottontails". Journal Wildlife Management.
33, 48-58.
[2] BURNHAM, K.P. & OVERTON, W.S. 1979. "Robust estimation ofpopulation size when
capture probabilities vary among animals". Ecology, 60, 927-936.
[3] CAROTHERS, A.D. 1973. "Capture-recapture methods applied to a population with
known parameters". Journal of Animal Ecology, 42, 125-146.
[4] CHAO, A. & LEE, S.M. 1992. "Estimating the number of classes via sample coverage".
Journal ofthe American Statistical Association, 87, 210-217.
[5] CROWCROFT, P. & JEFFERS, J.N.R. 1961. "Variability in the behaviour of wild
house nice toward live traps". Proceeding of the Zoological Society, 137, 573-582.
[6] EDWARDS, W.R. & EBERHARDT, L.L. 1967. "Estimating cottontail abundance from
live trapping data". Journal of Wildlife Management, 31, 87-96.
[7] EFRON, B. 1982. The jackknife, the bootstrap and the others resampling plans. SIAM.
Monographs, Nº 38, Philadelpia. SIAM.
[8] GRAY, H. L & SHUCANY, W.R. 1972. The generalizedjackknife statistic, New York:
Marce! Dekker.
[9] GOODMAN, L.A. 1949. "On the estimation of the number of classes in a population".
Annals of Mathematical Statistics, 20, 572-579.
[10] HAAS, P.J. & STOKES, L. 1996. Estimating the number of classes in a finite
population. IBM Research. Report RJ 10025, IBM Almaden Research Centre, San José, CA.
[11] HUBER, J.J. 1962. "Trap response of confined cottontail populations". Journal ofWildlife
Management, 26, 177-185.
[12] KORWAR, R.M. 1988. "On the observed number of classes from multivariante power
series and hipergeometric distributions". Sankhya: The lndian Journal of Statistics, 50, 39-59.
[13] MANLY, B.F.J. 1971. "Estimates of a marking effect with captures-recapture sampling".
Journal Applied Ecology, 8, 181-189.
[14] PRIETO MARTÍNEZ, J.J. 1998. "Una distribución asintótica para un estimador natural
del número de clusters en una población''. Qüestiió, 22, 3, 417-441
[15] PRIETO MARTÍNEZ, J.J. 2001. The number of dies to strike the coinage: A statistical
problem in ancient numismatic. XXVI Congreso Nacional de Estadística e Investigación
Operativa. (6-9 de Noviembre de 2001). Pag de Acta 158.
[16] SARNDAL, C.E., SWENSSON, B. & WRETMAN, J. 1992. Mode/-assisted survey
sampling. New York: Springer-Verlag.
63
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017
[17] SEBER, G.A.F. 1982. The Estimation of Animal Abundance. 2"d edition. London: Griffin.
[ 18] SHLOSSER, A. 1981. "On estimation of the size of the Dictionary of a long text on the
basis of a sample". Engineering Cybernetics, 19, 97-102.
64
© Del documento, de los autores. Digitalización realizada por ULPGC. Biblioteca Universitaria, 2017