?

Log in

жизнь без бумажек - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

жизнь без бумажек [июл. 14, 2009|05:49 pm]
Anatoly Vorobey
Я хочу избавиться от папок и ящиков старых бумаг, переведя их всех в отсканированный вид, а заодно все новые бумаги - квитанции, банковские распечатки, что угодно - начать сканировать и выбрасывать. Но для этого мне нужна программа, помогающая все это организовать и быстро находить нужное.

Я думаю, что мне нужно следующее: возможность быстро показывать отсканированные документы, лежащие в каком-то дереве директорий; назначать им таги и/или текстовые комментарии, и находить быстро по тагам или тексту. В принципе текст необязателен, достаточно одного поиска по тагам и году/месяцу. Неплохо бы, чтобы программа помогала как-то управлять этой иерархией директорий, и умела делать бэкапы на болванки. В крайнем случае без этого тоже можно обойтись.

Я изучил Picasa 3, и по-моему она делает почти все, что мне нужно. Мешает одна, но важная проблема: поскольку Picasa заточена под фото-коллекции, она не понимает и не принимает PDF-файлы. А мне как-то нужно хранить отсканированные многостраничные документы (напр. банковскую распечатку из нескольких страниц, или конспект старый). Может, можно было бы засунуть их в мультистраничные TIFF-файлы, но их Picasa хоть и ест, а показывать не умеет - показывает только первую страницу.

Поэтому у меня есть вопросы к тем, кто изучал эту проблему и как-то с ней научился справляться.

1) Есть ли программа, которая делает то, что мне нужно? Предпочительно open source, но если коммерческая и очень хорошая, тоже нормально.

2) Может, я неправильно понимаю, что мне нужно? Если вы успешно организовали это дело как-то по-другому, поделитесь своим методом.
СсылкаОтветить

Comments:
Страница 1 из 2
<<[1] [2] >>
[User Picture]From: itman
2009-07-14 03:01 pm
Я не очень понимаю, как это все быстро сканировать. Я это в шреддер отправить устаю, а тут сканировать.
(Ответить) (Thread)
[User Picture]From: m2b
2009-07-14 08:33 pm
Фотографировать можно на цифровую мыльницу.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: anton
2009-07-14 03:02 pm
Мне кажется, для таких целей идеально подошёл бы Evernote - заодно, он их распознает и даст по ним искать.
(Ответить) (Thread)
[User Picture]From: vorobiev
2009-07-14 03:07 pm
Тезка, вы меня опередили :-)
И с комментарием и с именем в ЖЖ :-) Тогда в 2001 году очень хотел взять ник с именем ...
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: vorobiev
2009-07-14 03:03 pm
Сервис Evernote смотрели?
Там можно создавать блокноты - соответственно организация по папкам.
Можно ставить метки.
Можно искать по дате и он распознает текст.
Насколько я помню в одну заметку можно аттачить несколько изображений, соответственно можно запихивать многостраничные документы.

Единственный минус - это веб-сервис. А значит встает вопрос доверия для хранения конфиденциальной и финансовой информации.
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 03:06 pm
даже пользовался одно время эверноутом, но именно для создания небольших notes. А он интегрирован каким-то образом со сканнером или с существующими отсканированными файлами? Или придется вручную на каждую бумажку создавать note в Evernote и аттачить к ней данный файл?

Веб-сервисность меня как раз не очень волнует, синхронизацию можно и выключить при желании.
(Ответить) (Parent) (Thread) (Развернуть)
(Удалённый комментарий)
[User Picture]From: tacente
2009-07-14 03:07 pm
Вот и я полез смотреть Evernote сегодня -- правда, немного с другими мыслями и целями, но кажется, что он для этой задачи должен подходить. Правда, сразу же столкнулся с глюком (установленная программа не входит в сеть). Но думаю, что это поправимо, а так кажется, что удобно. Они уверяют, что их распознавалки позволяют искать текст в картинках (типа сфотографированных визиток или квитанций - не на иврите, правда, но на русском да) и в рукописных записях. (Учитывая, что этим занимался Zhenyach, я им склонен верить.)
(Ответить) (Thread)
[User Picture]From: damian
2009-07-14 03:09 pm
Evernote.
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 04:33 pm
Спасибо, посмотрю еще раз.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: akuklev
2009-07-14 03:16 pm
www.neatco.com предлагает комбинированное софтверно-хардверное решение. Вроде очень хвалят, сам не пробовал.
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 04:33 pm
интересно, спасибо.
(Ответить) (Parent) (Thread)
[User Picture]From: potan
2009-07-14 03:16 pm
Бумага с печатью имеют юридическую силу. Если банк платеж потеряет, например.
В отличие от сканов.
(Ответить) (Thread)
[User Picture]From: meangel
2009-07-14 03:40 pm
Бумагу сканят вместе с печатью ) потом можно распечатать.
(Ответить) (Parent) (Thread)
From: p_a_s_h_a
2009-07-14 03:16 pm
А если вдуг возникнет какой-либо спор, допустим где то в базе кого-то, кому платили, потеряется квитанция и он решит, что надо "отключать от сервиса за неуплату". По-моему, решающим аргументом в споре будет именно оригинал квитанции...
(Ответить) (Thread)
[User Picture]From: mad_ghost
2009-07-14 03:27 pm
о, блин надо написать свою :) в общем главное это возможность сканирования я так понимаю. + древовидная структура хранения. Распознавалку имхо можно за деньги тока если от FineReader'a прикрутить. Там вроде есть такая лицензия. Но спасибо за идею.
(Ответить) (Thread)
[User Picture]From: jonni
2009-07-14 03:30 pm
http://www.dk-soft.org/products/phoa/index.php?action=viewinfo&product=phoa

Я пользуюсь этой вот программкой. Кажется именно она вам и нужна
(Ответить) (Thread)
From: mikhaelo
2009-07-14 03:30 pm
Я так живу примерно год. Сканирую счета, контракты, справки, документы и тд. с OCR (!) и складываю в разные папки несложной структуры дирректорий. Названия фалов примерно такие: yyyymmdd-tag1-tag2-...-tagx.pdf

Теперь, если мне нужно найти документ, я или кликаю по директориям или ищу поиском. Нахожу или контент в файле или тэг - в зависимости от сложности поиска.

Архив шифрую truecrypt и ношу с собой в мобилке или в лэптопе - регулярно надо посмотреть пару документов когда я, например, на работе.

Бумажные варианты сразу не выкидываю а "архивирую" в кульки для мусора и складываю в подвал. По закону моей страны некоторые бумаги надо хранить 3 года а некоторые 10 лет.
(Ответить) (Thread)
[User Picture]From: vodianoj
2009-07-14 03:41 pm
Мой знакомый сотрудник уже лет 5 сканирует все документы. Я с ним поговорю.
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 04:18 pm
спасибо, расскажи потом.
(Ответить) (Parent) (Thread)
[User Picture]From: rejoined
2009-07-14 03:43 pm
adobe bridge распознает и pdf, плюс тэги, поиски, даты.
(Ответить) (Thread)
[User Picture]From: photo_viewer
2009-07-14 06:16 pm
опередили. бридж - очень хорош для организации картинок. и без дурашливости пикасы.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: gholam
2009-07-14 03:46 pm
В комплекте сканеров Xerox DocuMate идёт программа Nuance PaperPort, делает вот это самое.
(Ответить) (Thread)
[User Picture]From: nameless__one
2009-07-14 03:47 pm
Пользовался пару лет Evernote именно для таких целей. Я, правда, оригиналы не уничтожаю на всякий случай. Когда Evernote переехала в веб - засомневался в них. Перешёл на MS OneNote. Там, правда, каталожная структура жёстко заданная и примитивная.
(Ответить) (Thread)
[User Picture]From: upd0wn
2009-07-14 03:55 pm
Уже много лет пользую PaperPort - вполне. легкая настройка, все форматы, OCR и т.д.
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 04:20 pm
а таги есть и поиск по ним? А импорт уже готовых отсканированнх файлов с картинками/PDF?
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: msh
2009-07-14 04:26 pm
Поскольку старые документы нужны редко, то если их просто сваливать в яшики и класть в подвал, математическое ожидание времени поиска нужного будет меньше чем при сканировании

В смысле, жалко времени-то этим заниматься
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 04:28 pm
у меня нет подвала, и я уже 10 лет тащу за собой ящики со старыми бумагами из одной квартиры в другую, и меня это задолбало до такой степени, что сил никаких нет.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: arturonly4
2009-07-14 04:43 pm
Прикольное хобби - сканирование старых бумажек :) А прогу такую универсальную не знаю :(
(Ответить) (Thread)
From: ex_benzel
2009-07-14 05:02 pm
Может быть вот это подойдет? http://evernote.com/
(Ответить) (Thread)
[User Picture]From: raindog_2
2009-07-14 05:07 pm

Fujitsu SnapScan

Важно иметь хороший сканер. С планшетным сканером такое сделать практически невозможно - слишком много сканировать. Я посоветовался с нашими коллегами, которые раньше работали в Xerox PARC над похожим проектом (что-то типа перехода на безбемажность). Они мне посоветовали Fujitsu SnapScan. Я его купил и доволен.

Как все это работает. Когда в него закладываешь несколько бумаг (например, счет за электричество), он сканирует с двух сторон, примерно страницу за пару секунд. Потом создает единый PDF и потом напускает на него OCR, так что в PDF-е можно искать по словам. PDFы он называет по дате-времени сканирования. Есть программа-менеджер, в которой можно создавать иерархию папок, и переименовывать документы (хотя я редко их переименовываю). Менеджер показывает большие thumbnails с содержимым файла, так что можно и без названия догадаться, что там. Есть поиск по словам. Ищет во всех PDF. Держит оно индекс, или тупо ищет в каждом PDF по очереди - я не понял. Пока что у меня там, наверное, несколько сотен документов, и ищет быстро.

Бекапы их софтвер, кажется, не делает, но PDF-ы - маленькие, все вместе занимает смешной объем, я просто копирую всю директорию на другой (внешний) диск периодически.
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 05:33 pm

Re: Fujitsu SnapScan

1) а таги можно добавить в программу-менеджер?

2) с какой резолюцией оно сканирует, так что файлы получаются маленькие? я не уверен, какую резолюцию выбрать для своих сканов.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: lavinya
2009-07-14 05:30 pm
А вот гляди-ка.
Это не решит твою проблему, но идея меня привела в восторг.
http://www.nytimes.com/2009/07/13/technology/internet/13mail.html?_r=1&partner=rss&emc=rss
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 05:32 pm
молодцы, да :)
(Ответить) (Parent) (Thread)
[User Picture]From: yankel
2009-07-14 05:44 pm
Я тоже об этом думал.
Вопрос на засыпку: в каком случае могут понадобиться подленники. Обычно в Израиле и копии принимают. Но фиг знаешь, где нарвешься.
(Ответить) (Thread)
[User Picture]From: onkel_hans
2009-07-14 05:51 pm
Я бы не стал хранить банковские документы на таком ресурсе, как Пикаса. Или Вы любите Большого Брата?

Для работы с файлами очень хорош Total Commander. Он легко делает поиск в файлах, в т.ч. в PDF файлах. Поддерживает комментарии к файлам.

Total Commander: http://www.ghisler.com
(Ответить) (Thread)
[User Picture]From: dimrub
2009-07-14 06:41 pm
Забавно читать посты, для которых являешься (по всей видимости) триггером :). Евернот тебе уже посоветовали, я вижу. Пытался понять, как его для этой цели использовать, так и не понял. В итоге пришел вот к чему. На работе есть нехилый сканер. В числе прочего, он умеет сканировать в PDF, либо все, что ему дали, в один, либо каждый лист в отдельный, а потом посылает все эти PDF-ы мейлом. Сканирую, переименовываю так, чтобы было понятно, что это (скажем, "ארנונה 2008 12.pdf" или "תלוש משכורת 2008 10.pdf") и загружаю на гугль-докс в специально созданную для этого иерархию фолдеров. Пока что загрузил подобным образом пару десятков бумажек, и мне нравится. Конечно, довольно много ручных шагов, которые хорошо бы автоматизировать, но я вдруг понял, что 90% времени занимает собственно сканирование, т.е. дойти до сканера, вставить, подровнять, ввести настройки и подождать пока отсканирует (и тут, как тебе верно написали, ключевым является выбор сканера: планшетный - не вариант), так что можно не напрягаться особо - все равно после того, как бэклог отработан, вся операция - это две минуты в день.

Принципиальный вопрос - это легальный статус отсканированного. Так, например, наша тетка, которая занимается финансами, сказала, что тлушим можно спокойно сканировать и выбрасывать, а вот тофес 106 выбрасывать не стоит.

Edited at 2009-07-14 18:42 (UTC)
(Ответить) (Thread)
[User Picture]From: avva
2009-07-14 08:43 pm
У меня на работе тоже есть такой нехилый сканер, но кол-во ручных шагов в описанной тобой системе меня все же пугает. Мне нужно что-то, что позволит мне не только обрабатывать новые бумажки, а отсканировать и каталогизировать *много ящиков* старых, и я думаю, что сломаюсь давать имя каждому отдельному клочку бумаги там и закачивать его в гугл докс.

Легальный статус меня не очень волнует, потому что я и сейчас в море того, что у меня есть, не могу найти то, что надо.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: dimrub
2009-07-14 06:58 pm
Да, и еще одна вещь: некоторые провайдеры услуг уже сами готовы посылать тебе счет по мейлу в виде PDF (только, почему-то, они не очень-то рекламируют эту услугу). Примеры - безек, орандж, селком, виза, банк дисконт. У некоторых из них эти пидиэфы еще и с дигитальной подписью.
(Ответить) (Thread)
[User Picture]From: zigmar
2009-07-14 07:39 pm
Кстати, да. Меня тоже жутко задолбала бумажная почка, и от значительной части её удалось избавиться передя на электронные рассылки. Хотя самые ценные бумажки - "тлушей маскорет", всякие пенсионные распечатки и т.д. всё равно приходится организовывать в бумажном виде. :-/
(Ответить) (Parent) (Thread)
Страница 1 из 2
<<[1] [2] >>