La limite de crawl de Google est désormais de 2 Mo.
Vérifiez si votre contenu HTML est tronqué par le bot d'indexation.
À propos de la limite de 2 Mo
Fichiers HTML : Googlebot cesse de crawler un fichier HTML après les 2 premiers Mo. Le contenu au-delà de cette limite n'est pas indexé. Cette limite s'applique aux données non compressées.
Ressources : Chaque ressource référencée dans le HTML (CSS, JavaScript) est récupérée séparément et soumise à la même limite de 2 Mo.
Fichiers PDF : Googlebot est plus généreux avec les PDF et crawle les 64 premiers Mo.
“Une fois la limite atteinte, Googlebot interrompt la récupération et n'envoie que la partie téléchargée pour l'indexation.”
— Google Search Central