Iwasawafag
→ arts
25.09.2011 06:32 netbook
арц, я вот заметил, что плюсач парсит пстач, как говно при постинге ссылки. Вот например из поста коняты:
lHooFool — Псто, я нашел новую развлекуху. 1. ... — psto.net (ссылка на титле страницы, все ок)
psto.net. Sign in |. ru. Blog Subscriptions Recommendations Bookmarks Comments. within threads; within tags; within users. lHooFool 14:15. Псто, я нашел новую развлекуху. 1. Заходим на ютуб. 2. Находи...
А вот описание в говно. Вместо поста оно пихает весь текст со страницы. При этом ссылка на какую-то запись с anidub.com вывела в дескрибшоне текст самого поста, не захватив ничего лишнего.
Думаю, дело в именах классов дива с телом поста. Но я документацию плюсача не читал @ сразу предполагал. Такие дела.
ЧОА
ну не ок же, что оно пихает в описание ссылки куски навигации. Это конечно проблемы кругла, но если все упирается в добавление одного класса, то почему бы не добавить?
Скажи какого — я добавлю.
ок, сейчас посмотрю ссылок 10 разных, чтобы уж наверняка, после чего отпишусь
нормально порсятся сайты с:
.post_content (есть мета, предложило картинки из img на превью из этого тега), .post-body (есть мета), #postcontent(не знаю), .content (не знаю), #content .msg (нет мета)
некорректно (так же цапает весь innerText со страницы):
.block-body, #content #posts li.post, #content
(в последнем случае тело поста так же не обвернуто во враппер и лежит вместе со всем остальным в этом диве). Наличи мета-тегов на этих сайтах так же не проверил)
Там где есть <meta name="description" content="..." /> Описание ссылки берется из этого тега
про мета-тег обратил внимание не сразу, проверил после некоторые из ссылок
С чего ты решил, что поисковики начали разбираться в классах? Нужно гуглить google seo.
при чем тут сео, когда речь о share-ссылках
Притом что гугл выбирает ту же информацию, что он берет для себя. Неужели ты думаешь, они ради этого придумывали новый алгоритм?