lunes, 12 de marzo de 2012

Administrando políticas de borrado en el crawl de Search de SharePoint Server 2010

SharePoint Server 2010 usa cuatro directivas que controlan la eliminación accidental de contenido, cuando el componente de rastreo (rastreador) encuentra errores intermitentes durante un rastreo. Estas directivas se controlan mediante propiedades de la aplicación de servicio de búsqueda y determinan el número de veces y por cuánto tiempo se reintentará un elemento en rastreos consecutivos.

A continuación se describen las cuatro directivas y los valores predeterminados de las propiedades (en negrita).

Directiva de eliminación para acceso denegado o archivo no encontrado

Cuando el rastreador (crawler) encuentra un error de acceso denegado o archivo no encontrado, se elimina el elemento de índice del índice de búsqueda de componentes de consulta, si se ha encontrado el error en más de ErrorDeleteCountAllowed rastreos consecutivos Y la duración desde el primer error es superior a ErrorDeleteIntervalAllowed horas. Si NO se cumplen ambas condiciones, se reintenta el elemento de índice.

El valor predeterminado de ErrorDeleteCountAllowed es 30 y el de ErrorDeleteIntervalAllowed es 720 horas (30 días).

Directiva de eliminación para todos los demás errores

Cuando el rastreador (crawler) encuentra errores que no son de acceso denegado o archivo no encontrado, se elimina el elemento del índice de búsqueda, si el error se encontró en más de ErrorCountAllowed rastreos consecutivos Y la duración desde el primer error es superior a ErrorIntervalAllowed horas. Si no se cumplen ambas condiciones, se reintenta el elemento.

El valor predeterminado de ErrorDeleteCountAllowed es 100 y el deErrorDeleteIntervalAllowed es 1440 horas (60 días).


Directiva de repetición de rastreo para contenido de SharePoint

Esta directiva solo se aplica a contenido de SharePoint. Si el rastreador (crawler) encuentra errores al capturar cambios de la base de datos de contenido de SharePoint en RecrawlErrorCount rastreos consecutivos Y la duración desde el primer error es de RecrawlIntervalCount horas, el rastreador (crawler) forzará una repetición del rastreo en esa base de datos de contenido.

El valor predeterminado de RecrawlErrorCount es 10 y el de RecrawlIntervalCount es 360 horas (15 días).


Directiva de eliminación de no visitados

En los rastreos completos de un origen de contenido, el rastreador (crawler) ejecuta una fase de eliminación de no visitados en la cual elimina los elementos que están en el historial de rastreo pero no se encontraron en el rastreo completo actual. Esta directiva la expone la propiedad DeleteUnvisitedMethod, que determina qué elementos se eliminan durante esta fase. Existen tres valores posibles:

  • Cuando DeleteUnvisitedMethod es 0, se eliminan todos los elementos no visitados.
  • Cuando DeleteUnvisitedMethod es 1 (valor predeterminado), se conservan los elementos no visitados que tienen el mismo host que la dirección de inicio especificada en el origen de contenido y se eliminan los elementos no visitados que se detectaron al seguir los vínculos a otros hosts.
  • Cuando DeleteUnvisitedMethod es 2, no se elimina ninguno de los elementos no visitados.

¿Cómo se pueden ver o cambiar estos valores?

Estos valores de propiedad SOLO se pueden cambiar en la aplicación de servicio de búsqueda mediante Windows PowerShell para SharePoint Server 2010.

Para ver el valor actual de una propiedad use el comando siguiente:

$sa=GetSPEnterpriseSearchServiceApplication

$sa.GetProperty("nombre de la propiedad")

Para cambiar el valor de una propiedad use el comando siguiente:

$sa=GetSPEnterpriseSearchServiceApplication

$sa.SetProperty("nombre de la propiedad", NewValue)

 

Más información:

http://technet.microsoft.com/en-us/library/ff608050.aspx

http://technet.microsoft.com/en-us/library/hh127009.aspx

No hay comentarios:

Publicar un comentario