La limite de crawl de Google est désormais de 2 Mo.

Vérifiez si votre contenu HTML est tronqué par le bot d'indexation.

À propos de la limite de 2 Mo

Fichiers HTML : Googlebot cesse de crawler un fichier HTML après les 2 premiers Mo. Le contenu au-delà de cette limite n'est pas indexé. Cette limite s'applique aux données non compressées.

Ressources : Chaque ressource référencée dans le HTML (CSS, JavaScript) est récupérée séparément et soumise à la même limite de 2 Mo.

Fichiers PDF : Googlebot est plus généreux avec les PDF et crawle les 64 premiers Mo.

“Une fois la limite atteinte, Googlebot interrompt la récupération et n'envoie que la partie téléchargée pour l'indexation.”
— Google Search Central