Пишем краулер на раз-два 1.0

Интернет-маркетинг | 5 марта 2019

SEO на Хабрахабре, seo, habrahabr.ru, Блог компании SEMrush

Пишем краулер на раз-два 1.0
Веб-краулер (или веб-паук) — это важная составная часть поисковых систем для обхода веб-страниц с целью занесения информации о них в базы данных, в основном, для их дальнейшей индексации. Такая штука есть у поисковиков (Google, Yandex, Bing), а также у SEO-продуктов (SEMrush, MOZ, ahrefs) и не только. И штука эта — довольно интересная: как в плане потенциала и вариантов использования, так и для технической реализации. Этой статьей мы начнем итеративно создавать свой велосипед краулер, разбирая многие особенности и встречая подводные камни. От простой рекурсивной функции до масштабируемого и расширяемого сервиса. Должно быть интересно! Читать дальше →
Поисковая оптимизация / [Из песочницы] Подбор ключевых слов с помощью базы Пастухова

Периодически задаюсь вопросом как облегчить труд нашим менеджерам по продажам. В этот раз речь зашла о подборе...

Подробнее
Разработка изоморфного RealWorld приложения с SSR и Progressive Enhancement. Часть 4 — Компоненты и композиция

В предыдущей части туториала мы решили проблемы изоморфного роутинга, навигации, фетчинга и начального состояния...

Подробнее
SEO в разработке eCommerce проектов (20 правил для разработчика)

В последний год мы написали много статей по UX / UI проектированию eCommerce проектов и не только. Концепция проекта и...

Подробнее
[Из песочницы] BEM'a не должно существовать

Здравствуйте. BEM'а не должно существовать. Есть огромное количество причин не использовать эту методологию, но...

Подробнее
Каскадные Таблицы Стилей / [Ссылка] Frame: Фреймворк нового поколения

После заевшегося 960.gs и Blueprint, захотелось чего то нового. Долго и упорно насиловал гугл, наткнулся на помесь...

Подробнее
Хватит паранойи или почему вам не светит 100 баллов в Page Speed

Йо-йо! Отличная штука SEO. Никто не знает, что делать наверняка, почему сайт «не в топ» и почему онлайн-бизнес не...

Подробнее

💬 Комментарии

В связи с новыми требованиями законодательства РФ (ФЗ-152, ФЗ «О рекламе») и ужесточением контроля со стороны РКН, мы отключили систему комментариев на сайте.

🔒 Важно Теперь мы не собираем и не храним ваши персональные данные — даже если очень захотим.

💡 Хотите обсудить материал?

Присоединяйтесь к нашему Telegram-каналу:

https://t.me/tcsecms/

Нажмите кнопку ниже — и вы сразу попадёте в чат с комментариями