Полезные программы или те, которыми я пользуюсь
| мая 7, 2009Парсинг текстов
1.
Ночной дозор
Описание:
Ночной дозор - это универсальный парсер контента. Сайто-рубилово я бы сказал.
Можно выдерать контент по расписанию, по рубрикам, картинки автоматически скачиваются.
Выдрать текст можно практически откуда угодно, все зависит от ваших извращений с тегами.
Есть платная и бесплатная версия, нам достаточно и халявной, которая с некоторой периодичностью перестает работать, тогда нам нужно будет подождать апдейта от автора и скачать новую версию.
Мануал: http://alensoft.com/Dozor/CreateChannel.exe
Сайт: http://alensoft.com/
Скачать: http://alensoft.com/Dozor/NewVersion.php
Парсинг рисунков
2.
Extreme Picture Finder
Описание:
Отличная софтина поиска картинок по ключивикам. Как и во многих ПС есть возможность исключать слова из поиска знаком “-” перед словом.
Мануал:
- Открываем программу
- Вверху слева выбираем кнопку New Search или Ctrl+N
- Пишем слова для поиска
- Next Next Next Finish
- Жмем синюю стрелку вверху, начнут загружаться картинки. Те которые не нужны можно удалять прямо в программе выделив и нажав кнопку делейт.
Сайт: http://www.exisoftware.com/
Обработка напарсеного
3.
HTML Cleaner
Описание:
Маленькая, быстрая программа для очистки хтмл от мусора. Отлично чистит от лишних тегов после Microsoft Word. Правила очистки можно писать самому, так что можно использовать для разных целей.
Мануал:
Достаточно выбрать необходимые нам файлы и перетащить их в окно программы.
Сайт: http://norse.ulver.com/person/stridmann/java/htmlcleaner/index.html
Скачать: http://norse.ulver.com/person/stridmann/java/htmlcleaner/index.html
4.
TXTcollector
Описание:
Утилита для склейки файлов. В отличие от Тотал Коммандера не требует строгие имена файлов. Может автоматически вставлять перевод на следующую строку, разделитель и имена файлов.
Мануал:
- Выбриаем тип и папку где файлы лежат кнопкой 1
- Клеим все кнопкой 2
Сайт: http://norse.ulver.com/person/stridmann/java/htmlcleaner/index.html
Скачать: http://users.telenet.be/david.de.groot/progs/TXTcollector.zip

