Парсить афишу кино, откуда?

#1 17 сентября 2014 в 14:17
Собственно весь вопрос в сабже. Откуда парсить афишу кино? Кроме кинопоиска и афиша.ру есть ресурсы?
Кинопоиск не нравится тем, что данные обновляются в четверг… По крайней мере, по нужному мне городу…
#2 17 сентября 2014 в 14:33

Откуда парсить афишу кино

Евгений
Расскажите куда парсить собираетесь и чем joke
#3 17 сентября 2014 в 17:26

Расскажите куда парсить собираетесь и чем

Melon
пишу компонент для 2.0… Только по кино. Парсится будет curl-ом (точнее уже парсится с кинопоиска, но еще нет компонента), подстановка рандомного юзер-агента уже есть, задержка между запросами тоже, так что можно предлагать ресурсы с защитами от ботов.
#4 17 сентября 2014 в 18:05

подстановка рандомного юзер-агента уже есть, задержка между запросами тоже, так что можно предлагать ресурсы с защитами от ботов.

Евгений
Как на счет банальной проверки _SERVER['REMOTE_ADDR']?
#5 17 сентября 2014 в 19:26

Как на счет банальной проверки _SERVER['REMOTE_ADDR'] ?

stealthdebuger

$_SERVER['REMOTE_ADDR'] сюда записывается IP адрес, машины которая запрашивает, скрипт, и заполняется он информацией которую передаёт вебсервер к ПХП.
Возможно ли , remote_addr подделать ip адрес в пакете с помошью perl raw_socket (используется в Ddos ) ?
Возможно ли, в определении IP адреса, доверяя дополнительным заголовкам HTTP_* (например HTTP_X_FORWARDED_FOR) поделать client_ip но remote_addr от этого не изменится?
А если определить глобальную переменную например extact,import_global_variables допустим с неверными аргументами, тогда возможно переопределить данные в переменную $_SERVER['REMOTE_ADDR' ?
Информация профессионалов есть основной фактор для стартовой деятельности многих развивающихся программистов.
Я очень прошу ВАС, уважаемый СТЕЛС, немного помочь пинками ногою в определенном движении.
Вот банально? Проверка_SERVER['REMOTE_ADDR'] ?
Для ВАС банальна потому что путь по битому стеклу пройден!
Предлагаю УВАЖАЕМОМУ СООБЩЕСТВУ ICMS, принять товарища stealthdebuger. как нашего товарища той самой партии ICMS, в которой он будет Министром Безопастности ICMC
Реально, и серьезно.
PS//Я реально прошу о том что пишу.!
#6 17 сентября 2014 в 20:48
oll, с точки зрения безопасности стоит доверять лишь REMOTE_ADDR и никогда не доверять никаким переменным, название которых начинается с HTTP_.
Множество самописных систем компроментируются именно из-за слепого доверия к массиву $_SERVER.
Но, даже REMOTE_ADDR я могу вам задать абсолютно любой (смотрите CURLOPT_INTERFACE). Другое дело, что я не смогу получить ответ от вашего сервера, если указанный мной IP не ассоциирован с сервером, с которого я отправляю запрос. Если, конечно, я не натянул "носки" и не отправляю свои запросы через него.
Если вести речь об HTTP_X_FORWARDED_FOR и прочим подобным, если вы подразумеваете под этим использование proxy, то практически любые паблик-прокси довольно быстро оказываются "мертвыми", либо в стоп-листах систем "защиты от ботов". Кроме того, можно, не разрывая созданного соединения, послать b-request, воспользоваться UDP и т.д. и т.п.
Что касается проверки _SERVER['REMOTE_ADDR'], то я употребил слово "банальной" лишь потому, что ни одна самая простейшая система "защиты от ботов" не обходится без данной проверки.
#7 17 сентября 2014 в 21:07

то я употребил слово "банальной" лишь потому, что ни одна самая простейшая система "защиты от ботов" не обходится без данной проверки.

stealthdebuger
Как вы считаете stealthdebuger? Возможно осуществить в оболочке ICMS — базовый безопасный класс для аналогичных решений.
Система будет развиваться, и каждый разработчик будет использовать методы в зависимости от уровня знаний и методов решений на основе этих знаний.
#8 17 сентября 2014 в 21:09
И все же вернемся к теме. Какие еще источники афиши кино вы знаете?
#9 17 сентября 2014 в 21:10
oll, это называется WAF. Лично вам я бы порекомендовал обратить внимание на WAF используемый в Bitrix
#10 17 сентября 2014 в 21:18

Какие еще источники афиши кино вы знаете?

Евгений
www.imdb.com/
Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.