SiteSputnik. Документы, файлы, списки, таблицы
SiteSputnik. и другая выдача программы
Автор
Алексей Мыльников
Дата выхода публикации - 19.06.18г.     
Последнее изменение - 25.04.19г.     



Аннотация
    В данной публикации собрана основная выдача, создаваемая программой SiteSputnik.


Перечень документов, файлов, списков, таблиц
    Название файла - его назначение ... .

  1. Пакет, проект - текст выполняемого задания, а именно: простого запроса, пакета запросов, Проекта.

  2. URL-источников - список в виде текстового документа адресов всех задействованных в Проекте элементарных Источников информации.

  3. Экспорт-txt - список в виде текстового документа адресов всех найденных ссылок в Проекте.

  4. Экспорт-htm - список в виде html-документа адресов всех найденных ссылок в Проекте.

  5. Объединение - список в виде сниппетов всех найденных ссылок в Проекте.

  6. Ссылки новые - список в виде сниппетов всех новых уникальных ссылок, точнее тех ссылок, которые не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные ссылки).

  7. Экспорт-новые-txt - список в виде текстового документа адресов всех новых уникальных ссылок.

  8. Сайты новые - список только новых уникальных сайтов, ссылки с которыx не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные сайты).

  9. Домены 3-го уровня новые - список только новых уникальных доменов 3-го уровня, ссылки с которых не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные домены 3-го уровня).

  10. Ссылки открытые - список в виде сниппетов тех ссылок, которые хотя бы один раз были ранее открыты или скачаны в Проекте.

  11. Общие - список в виде сиппетов ссылок, которые были найдены абсолютно всеми источниками, задействованными в Проекте. Создается, если такие ссылки обнаружены.

  12. Все сниппеты - если ссылка была найдена несколькими источниками, то сниппеты из разных источников для каждой ссылки объединяются в один большой общий сниппет.
    Удобно, в частности, еcли ссылка была удалена и её содержание ищется в Кэш.

  13. Заголовки - перечислены только заголовки и адреса ссылок (упрощенные сниппеты). Применимо практически для всех описанных и выше, и ниже документов.

  14. Выдача источника - для каждого источника его выдача может быть сохранена в отдельном файле.

  15. Аналитическое объединение - несколько списков Объединение (или списков Новые) объединяются в один список.
    Чем в большем количестве объединяемых списков присутствует ссылка, тем ближе к началу результирующего списка она расположена!

  16. Разность - из одного списка удаляются ссылки, присутствующие в другом списке.

  17. Карты - иерархическая структура из адресов ссылок, найденных в Проекте (несколько деревьев).
    Также в отдельных файлах создается папочная, ресурсная и доменная структура web-пространства, попавшего в Проект.

  18. Карта сайта - иерархическая структура из принадлежащих сайту адресов ссылок, найденных в интернете.
    Обращения к самому сайту не выполняются, выполняются только запросы в поисковиках.
    Материализация видимого интернета.

  19. RSS-потоки все - список всех RSS-потоков, адреса которых размещены на открываемых или скачиваемых страницах в Проекте.

  20. RSS-потоки новые - список только тех RSS-потоков, которые не встречались ещё ни разу ранее при выполнении Проекта.

  21. RSS-потоки новые+ - список только тех RSS-потоков новых, контент которых содержит заданную ключевую фразу.

  22. URL-ссылки все - список всех ссылок, скачанных или размещенных в контенте скачанных и удовлетворяющих фильтру.

  23. URL-ссылки новые - список тех URL-ссылок, которые не встречались ещё ранее.

  24. URL-потоки новые - потоки ссылок или сниппетов, несущие URL-ссылки новые (это не RSS-потоки).

  25. URL-потоки новые+ - список только тех URL-потоков новых, контент которых содержит заданную ключевую фразу.

  26. Статистика по Источникам текущая (зеленая табличка) - показывает в абсолютном и процентном выражении эффективность работы каждого источника, а именно: сколько найдено им ссылок всего, сколько новых, сколько попавших в рубрики.

  27. Статистика по Источникам обобщенная (голубая табличка) - показывает "усредненную" эффективность работы источников из текущего Проекта, опираясь на Статистики текущие.

  28. Статистика по Источникам полная (розовая табличка) - показывает "усредненную" эффективность работы всех когда-либо примененных в Проекте источников.

  29. Замечание: Все текущие статистики (п.25,28-31) могут быть представлены в xlsx-формате и выгружены во внешнюю папку.

  30. Статистика по Рубрикам текущая сокращенная - показывает сколько ссылок попало в каждую Рубрику при текущем выполнении Проекта.


  31. Статистика по Рубрикам+Источники+их домены текущая - показывает сколько ссылок попало в Рубрику в разрезе Рубрика-Источник.

  32. Статистика по Рубрикам+Домены Ссылки текущая - показывает сколько ссылок попало в Рубрику в разрезе Рубрика-Домен ссылки.

  33. Статистика по Рубрикам текущая расширенная - самые подробные сведения о Рубриках, Источниках, доменах ссылки и источника, ссылках, ... задействованных в Проекте.

  34. Статистика по Рубрикам (желтая табличка) - показывает когда и сколько ссылок попало в каждую Рубрику (история заполнения Рубрик для заданного количества Пректов).

  35. График по статистике - графическое отображение Статистики по Рубрикам. Пример инфографики для Проекта "Финансы"

  36. Сигнализация - табличка для Статистики по Рубрикам, описывающая условия возникновения сигнала.

  37. Чистый поток - полнотекстовая лента из очищенных от мусора контентов всех ссылок, найденных и скачанных в Проекте.

  38. Символьный поток - полнотекстовая лента из необработанных контентов всех ссылок, найденных и скачанных в Проекте.

  39. Повторные - дубли контентов из Чистого потока перемещаются в этот документ.

  40. Все комментарии - лента из комментариев, написанных к ссылкам из "Чистого потока".

  41. Рубрика (Всё по Рубрике) - выборка (полнотекстовая лента) из "Чистого потока" или из "Все комментарии", удовлетворяющая правилам попадания в Рубрику.

  42. Пост-запрос - специальная рабочая Рубрика. Её правила прописываются не в иерархии Рубрик, а в настройках. Применяется и в +WebSpider, и в +News.

  43. Рубрика-ссылки - перечислены все Рубрики, задействанные в Проекте, и для каждой Рубрики перечислены все попавшие в неё ссылки.

  44. Ссылка-Рубрики - перечислены все ссылки, найденные в Проекте, и для каждой ссылки перечислены Рубрики, в которые она попала.

  45. Неоткрывшиеся - перечислены все ссылки, которые не удалось после нескольких попыток открыть или скачать на любом этапе выполнения Проекта.

  46. Невидимые - перечислены отсутствующие в поисковиках, но существующие и найденные методами поиска в невидимом интернете ссылки сайта.

  47. Подсвеченные зеленым фразы - могут быть выведены в отдельный одноименный файл.

  48. Упоминание объектов - список ЮЛ и ФЛ, присутствующих на самых релевантных ссылках, вычисленных при сборе информации об объекте, и количество их упоминаний.

  49. Tаблица-htm - табличное представление документа в виде html-таблички (доступно для многих документов из этого списка).

  50. Таблица-xls - табличное представление документа в виде Excel-таблички (доступно для Рубрик и Чистых потоков).

  51. JSON-файл - представление документа в json-формате (доступно для Рубрик и Чистых потоков).

  52. Локальный файл - практически любой документ может быть отправлен в любое количество папок локальной сети.

  53. Web-файл - практически любой документ может быть отправлен в любое количество папок заданного сайта.

  54. E-mail-файл - практически любой документ может быть отправлен по заданным электронным почтовым адресам.

  55. Проект главный - полный текст проекта, связанный с текущей папкой (текущим ящиком). Он хранится в библиотеке готовых проектов.

  56. Проект расширенный - содержит автоматически обнаруженные и автоматически подключенные источники вида RSS-потоки и URL-потоки, приносящие информацию в Рубрики.

  57. Проект проверочный - текст проекта, содержащий источники-кандидаты на попадание в Проект расширенный.

  58. Проект исполняемый - текст проекта, который выполнен. Может совпадать с главным, проверочным, расширенным проектом или получен из пакета с параметрами.

  59. Журнал ошибок и предупреждений - все ошибки, предупреждения и замечания по работе Проекта - в одном месте.

  60. Практически любая выдача программы может быть сохранена как документ в формате PDF, DOCX, RTF, TXT, MHT, HTM или конвертирована в формат xlsx и json.

  61. Лог-файл программы - регистрация в хронологическом порядке основных действий программы и запоминание их в текстовом файле.



Экспорт документов
Вся выдача программы СайтСпутник, перечисленная в данной публикации, доступна для других Приложений (программ).


Список литературы.
Полный список публикаций о программе собран на этой странице http://sitesputnik.ru/Public.htm.
Сайт о программе - http://sitesputnik.ru/.
Скачать демо-версию программы можно отсюда.


Copyright © 2003-2019 ИП Мыльников Алексей Борисович. Все права защищены. E-mail: 1a@sitesputnik.ru, +7(8442) 73 71 23, +7(905) 3 92 97 92