Le krigeage est plus complexe que l'interpolation par les voisins naturels. Il nécessite un modèle de la continuité ou dépendance spatiale (sous la forme d'une covariance ou d'un semi-variogramme) et un échantillon de données de surface pour définir la tendance statistique sur laquelle baser des points interpolés/extrapolés.
La prédiction spatiale à l'aide du krigeage s'effectue en deux étapes :
Vous devez sélectionner les emplacements de sortie des points interpolés. Il est important de s'assurer que les données d'échantillonnage sont appropriées pour les emplacements de points interpolés (la sortie). Par exemple, ne sélectionnez pas de points sur le côté opposé de la surface pour déterminer une tendance des emplacements de points interpolés/extrapolés, car la tendance risque de ne pas être appropriée pour ces emplacements.
Pour de meilleures performances, il est recommandé de limiter la taille du jeu de données d'exemple. En effet, la durée de l'interpolation et la quantité de mémoire utilisée par l'algorithme sont proportionnelles à la taille du jeu d'exemple. L'algorithme utilise une matrice avec une entrée pour chaque paire de points (N**2 entrées, où N représente le nombre de points d'échantillonnage). Il inverse ultérieurement cette matrice (N**3 opérations). Ainsi, pour de bonnes performances, il est important que N reste petit. Nous recommandons 200 points d'échantillonnage maximum.
La semivariance est la mesure du degré de dépendance spatiale entre des échantillons. L'amplitude de la semivariance entre des points dépend de la distance qui les sépare. Une distance moindre produit une semivariance plus petite et une distance plus importante entraîne une semivariance plus grande. Le tracé des semivariances en tant que fonction de distance à partir d'un point est défini comme un semi-variogramme.
Le krigeage fournit cinq modèles de semi-variogrammes
La semivariance augmente parallèlement à la distance jusqu'à ce que, à une certaine distance, la semivariance corresponde à la variance avoisinant la valeur moyenne, et par conséquent cesse d'augmenter, entraînant une zone plate sur le semi-variogramme appelée seuil. La distance entre le point d'intérêt et le début de la zone plate est identifiée comme étant l'intervalle ou l'espace de la variable régionalisée. Dans cet intervalle, les emplacements sont liés les uns aux autres et tous les échantillons connus de cette zone, également définis en tant que voisinage, doivent être pris en compte dans l'évaluation du point d'intérêt inconnu.
Le centre du voisinage est généralement la valeur inconnue. Pour déterminer cette valeur, une pondération est attribuée à toutes les valeurs connues du voisinage à l'aide du semi-variogramme. Cette pondération et valeurs connues sont ensuite utilisées pour calculer la valeur inconnue.