a close match to the farm with the missing item. 
The census imputation algorithm relied on a pre- 
established donor pool. The donor pool included 
a collection of completed reports that had 
successfully navigated the edit. The pool was 
further divided into groups of similar type and 
size, referred to as profiles. When the edit 
determined the need to impute an item, it went to 
the appropriate profile and searched for the best 
fit. Best fit was determined by calculating 
“distance” between the incomplete report and 
each candidate donor using a set of match 
variables. Match variables were specific to each 
section of the report form and included the 
latitude and longitude of the principal county of 
operation. The distance was the sum of the 
squared differences between the reported values 
of the match variables. The donor with the 
smallest distance was considered the “nearest 
neighbor” and became the source for the 
imputation action. The value returned may have 
been a direct copy of the donor’s value. In many 
cases, a relationship between two related 
variables on the donor record was applied to a 
reported value on the incomplete record. Using 
crop production as an example, the donor’s 
production was divided by its harvested cuerdas 
(yield) and multiplied by the recipient’s 
harvested cuerdas to obtain imputed production. 
The imputation process was imbedded in the 
edit. When the edit determined an item required 
imputation, the edit program launched the 
algorithm, waited for a value to be returned, 
validated that the returned value was satisfactory, 
and resumed editing. Since imputation was 
conducted independently for each occurrence, 
reports requiring multiple imputations drew from 
multiple donors. 
Initial donor pools were established before the 
first batch edits were run. These donor pools 
were “seeded” with 2007 census data that were 
“mapped” to look like 2012 data and passed 
through the 2012 edit to ensure they were 
consistent using the 2012 data relationships. As 
2012 data were successfully processed, new 
records systematically replaced the older records 
in the donor pool. The older records disappeared 
entirely from the donor pool after the first few 
El principio fundamental para la imputacion de valores 
se basa en encontrar una finca con caracteristicas 
semej antes para una partida en especifico. El algoritmo 
de imputacion del censo dependio de un grupo de 
donantes preestablecido. El grupo de donantes se creo 
utilizado una coleccion de informes completes que 
habian navegado con exito el programa de revision. El 
grupo de donantes se dividio en grupo s con 
caracteristicas similares tales como tipo de finca, y 
tamano. Estos grupos de denominaron como perfiles. 
Cuando el programa determine la necesidad de imputar 
una partida, el programa identifico el perfil adecuado y 
busco el valor de mejor ajuste. El valor de mejor ajuste 
se determino mediante el calculo de la "distancia” entre 
el cuestionario incompleto y cada donante disponible 
utilizando una serie de variables con valores semej antes. 
Estas variables eran especificas para cada seccion del 
cuestionario e inclman la latitud y la longitud del 
municipio principal donde se encontraba localizada la 
finca. La distancia se calculo sumando las diferencias al 
cuadrado entre los valores reportados por las variables 
de valores semej antes. El donante con la distancia mas 
pequena era considerado el " vecino mas cercano " y se 
convirtio en el valor utilizado para la imputacion. El 
valor utilizado para la imputacion puede haber sido una 
copia directa del valor del donante En otros casos, una 
proporcion de valores entre variables del donante fue 
aplicada a un valor reportado. Utilizando como ejemplo 
la produccion de cultivos, el rendimiento del donante se 
multiplico por el nilmero de cuerdas cosechadas del 
receptor para obtener la produccion imputada. 
El proceso de imputacion se ejecuto como parte del 
programa de revision. Cuando el programa de revision 
determino necesaria la imputacion de una partida, inicio 
automaticamente el algoritmo de imputacion, espero por 
el calculo de un valor substituto, verifico que el valor 
substituto fuese satisfactorio, y reanudo nuevamente la 
revision de datos. Dado que la imputacion se realizo 
independientemente para cada partida, los cuestionarios 
que requirieron multiples imputaciones potencialmente 
utilizaron multiples donantes. 
Se establecieron conjuntos de donantes iniciales antes de 
que se ejecutaran las primeras revisiones en grupos de 
cuestionarios, utilizando los datos del Censo 
Agropecuario del 2007. Estos datos fueron revisados 
para que fuesen similares a los datos del Censos 
Agropecuario del 2012. Segiin se fueron procesando los 
A - 6 APPENDIX A/APENDICE A 2012 Census of Agriculture 
USDA, National Agricultural Statistics Service 
