Форум blap.ru
21 Январь 2018, 01:36:20 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.

Войти
Новости: Массовая зачистка духов
 
   Начало   Помощь Поиск Календарь Войти Регистрация  
Страниц: [1] 2   Вниз
  Печать  
Автор Тема: Сверхпарсер Articlesbase.com  (Прочитано 14287 раз)
0 Пользователей и 1 Гость смотрят эту тему.
snoa
Администратор
Ветеран
*****

Репутация 705
Офлайн Офлайн

Сообщений: 1599


агент


Просмотр профиля WWW
« : 06 Июль 2009, 01:55:32 »

Ориентировочно завтра начнем раздачу парсера английских статей. Цена в течении суток как обычно, $15, потом на плати.ру чуть дороже. Стучать в ПМ или почту.
Записан

unsound methods
enjoy
Пользователь
***

Репутация 1
Офлайн Офлайн

Сообщений: 127


Просмотр профиля
« Ответ #1 : 06 Июль 2009, 16:12:34 »

Практическое применение англицких статей подскажите... Кроме складирования на винт).
Ну сайты понятно.
В Сапе их не покупают слыхал. Адсенс?...но это сайт раскрутить ещё нужно, да и биды щас смешные.
Перевод?...текст "покруче" синонимизированного будет, в том смысле что бреда не меньше.
Эх, говорила мне мама в детстве: - учи английский язык)))
Записан
snoa
Администратор
Ветеран
*****

Репутация 705
Офлайн Офлайн

Сообщений: 1599


агент


Просмотр профиля WWW
« Ответ #2 : 06 Июль 2009, 21:57:05 »

Ну кто-то просил сделать, и вот..
Записан

unsound methods
enjoy
Пользователь
***

Репутация 1
Офлайн Офлайн

Сообщений: 127


Просмотр профиля
« Ответ #3 : 07 Июль 2009, 09:59:02 »

Я ж и спрашиваю тех кто просил) т.е. форумчан.
Записан
Bambr
Администратор
Ветеран
*****

Репутация 48
Офлайн Офлайн

Сообщений: 750


добрый транклюкатор


Просмотр профиля WWW
« Ответ #4 : 20 Июль 2009, 05:59:10 »

Ну а если прогнать английские статьи через правильно настроенный PROMT - разве уникального текста на выходе не получиться? Я так думаю что вполне...
Записан
jkvoka
Старожил
****

Репутация 6
Офлайн Офлайн

Сообщений: 253


Просмотр профиля WWW
« Ответ #5 : 11 Сентябрь 2009, 13:23:13 »

при парсинге в 90% случаев происходит сбой.
Находятся статьи, начинается процесс сбор и останавливается.

В логе вот такое:
ERROR: Traceback (most recent call last):
  File "spab.py", line 71, in run
  File "Format\Articlesbase.pyo", line 101, in read
  File "spab.py", line 87, in _logger
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2013' in position 43: ordinal not in range(128)
Записан

snoa
Администратор
Ветеран
*****

Репутация 705
Офлайн Офлайн

Сообщений: 1599


агент


Просмотр профиля WWW
« Ответ #6 : 11 Сентябрь 2009, 22:42:25 »

стали выдавать в уникоде, а раньше в аски. поправлю асап.
Записан

unsound methods
Bambr
Администратор
Ветеран
*****

Репутация 48
Офлайн Офлайн

Сообщений: 750


добрый транклюкатор


Просмотр профиля WWW
« Ответ #7 : 13 Сентябрь 2009, 00:37:57 »

OFFTOPIC
поправлю асап.
необычно было встретить это выражение в рунете, с непривычки долго втыкал))))))
*кто не в курсе - as soon as possible
Записан
snoa
Администратор
Ветеран
*****

Репутация 705
Офлайн Офлайн

Сообщений: 1599


агент


Просмотр профиля WWW
« Ответ #8 : 13 Сентябрь 2009, 01:01:08 »

to jkvoka: файл ушел, теоретически поправил. если будет повторяться - засылайте параметры при которых возникает ошибка.
to Bambr: типа "как только так сразу", только не так обидно.
Записан

unsound methods
drmax
Администратор
Ветеран
*****

Репутация 556
Офлайн Офлайн

Сообщений: 1545



Просмотр профиля WWW
« Ответ #9 : 13 Сентябрь 2009, 11:10:38 »

Чувствуется старая фидошная закалка у тов. snoa
Записан

Измышления на тему SEO оптимизации
jkvoka
Старожил
****

Репутация 6
Офлайн Офлайн

Сообщений: 253


Просмотр профиля WWW
« Ответ #10 : 13 Сентябрь 2009, 12:00:42 »

получено, пробуем. асап получился быстрый )))
Записан

Bambr
Администратор
Ветеран
*****

Репутация 48
Офлайн Офлайн

Сообщений: 750


добрый транклюкатор


Просмотр профиля WWW
« Ответ #11 : 16 Сентябрь 2009, 12:55:25 »

jkvoka
а как инглиш применяешь, если не секрет ? )
Записан
WebBat
Новичок
*

Репутация 0
Офлайн Офлайн

Сообщений: 15



Просмотр профиля
« Ответ #12 : 02 Октябрь 2009, 23:30:31 »

У меня проблемка с парсером error.log

Traceback (most recent call last):
  File "spab.py", line 71, in run
  File "Format\Articlesbase.pyo", line 90, in read
  File "Format\Articlesbase.pyo", line 44, in _get_page
  File "urllib2.pyo", line 124, in urlopen
  File "urllib2.pyo", line 381, in open
  File "urllib2.pyo", line 399, in _open
  File "urllib2.pyo", line 360, in _call_chain
  File "urllib2.pyo", line 1107, in http_open
  File "urllib2.pyo", line 1080, in do_open
  File "httplib.pyo", line 928, in getresponse
  File "httplib.pyo", line 385, in begin
  File "httplib.pyo", line 349, in _read_status
BadStatusLine

В папке Articlesbase архив library.zip так и должен быть заархивирован?
Записан
snoa
Администратор
Ветеран
*****

Репутация 705
Офлайн Офлайн

Сообщений: 1599


агент


Просмотр профиля WWW
« Ответ #13 : 03 Октябрь 2009, 02:10:54 »

да. должен.
настройки засылайте при которых возникает ошибка на helljump@gmail.com
Записан

unsound methods
4ip
Гость
« Ответ #14 : 06 Октябрь 2009, 12:46:36 »

Заинтересовал данный парсер, скорее всего куплю его. Только вот вопросик, неплохо бы к нему и синонимайзер, а то просто так постить без синонимизации стремно, есть сторониие синонимайзеры но хотелось бы получить что-то от родного производителя, да и работать было бы удобней
Записан
Страниц: [1] 2   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.15 | SMF © 2006-2011, Simple Machines Valid XHTML 1.0! Valid CSS!