Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 4 
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 04.07.2005
Откуда: Саратов
есть файл весом ~~ 1 мегабайт, там хранятся побитые базы данных смартфона, (pim.vol) в неизвестной кодировке, и еще там телефоны формата 89ххххххххх и +79ххххххххх как мне отсеить из этого всего хлама эти номера? очень нужно, там хранятся контакты важные для меня.
ПС открывается этот файл всем и оперой, IE, блокнотом и экселем и пр. текстовыми редакторами и браузерами.

_________________
use processor on default :)



Партнер
 

Member
Статус: Не в сети
Регистрация: 01.04.2005
Откуда: Москва-Лубянка
# cat yourfile | egrep [0-9]{11} > numbers.txt

:D

Приведи хоть кусочек файла-то..

_________________
AnossovPavel в проекте F@H (TSC!Russia)
退屈な祖父 ¤ παππούς ¤ («клан дедов»)


 

Member
Статус: Не в сети
Регистрация: 04.07.2005
Откуда: Саратов
Код:
 +79044397089     : :    Ры H7%O˜  ђѓ'O˜              Ђ 88444512049     : :    Ры ш
)O˜  Ѕ)O˜              Ђ 88454412049     : :    Ры ь˜-O˜  @ђ.O˜              Ђ 88454474180     : :    Ры ЁЁ5O˜  њГ5O˜              Ђ 88452974480     : :    Ры „“ P˜  ґЉ“ P˜              Ђ 88452244291     d d    щ 0 — P˜  Њ— P˜             Ђ   Ђ" " 89033854406 :20,   =O  m     J@    Z  vВ0Р    : :    Ры  ф¦ P˜  њШЁ P˜              Ђ 88444279931     j j    щ Р@І P˜  0JІ P˜             Ђ &Ђ( ( 89044286595 8<0,     m       ђI@    +  )Ч{    : :    Ры |Ѓ¶ P˜  м˜¶ P˜              Ђ 88452974480     ` `    щ ДЏє P˜  °Јє P˜             Ђ Ђ  88454454971 5=0489  h    
ђI@    ,  *6п+    U U    щ Zѕ P˜  Zѕ P˜             Ђ Ђ  274450 ><    m    `F@    g   њі!Т    d d    щ И*Б P˜  ¬7Б P˜             Ђ   Ђ" " 89034454806 :20,   =O  m     J@    Z  vВ0Р    d d    щ H1В P˜  (`В P˜             Ђ   Ђ" " 89044854806 :20,   =O  m     J@    Z  vВ0Р    d d    щ ˜`К P˜  PlК P˜             Ђ   Ђ" " 89034454806 :20,   =O  m     J@    Z  vВ0Р    d d    щ ЂRя P˜  ЂRя P˜             Ђ   Ђ" " 89034454806 :20,   =O  m     J@    Z  vВ0Р    U U    щ dрP˜  ф#P˜             Ђ ЂЂ  89604489132 Kisa m    0E@       ёАXD    l l    щ и,P˜  |>P˜             Ђ (Ђ* * 89044433131 =B>=  A k a   T t g   m    аH@    у   3ѓ^    l l    щ   P˜  D' P˜             Ђ (Ђ* * 89044433131 =B>=  A k a   T t g   m    аH@    у   3ѓ^    U U    щ °ЕP˜  °ЕP˜             Ђ ЂЂ  89644589132 Kisa m    0E@       ёАXD    U U    щ кP˜  шP˜             Ђ ЂЂ  89603544132 Kisa m    0E@       ёАXD    U U    щ „†P˜  „†P˜             Ђ ЂЂ  89604489132 Kisa m    0E@       ёАXD    : :    Ры Ш,'P˜  ,Q'P˜              Ђ 88444974180     @    +  )Ч{    0,     m       ђI@    +  )Ч{    0,     m       ђI@    +  )Ч{    п+    п+       ,  *6п+       ,  *6п+       ,  *6п+    5=0489  m    
ђI@    ,  *6п+    +    +    @    +  )Ч{   0E@       ёАXD 89603449132 Kisa m   д Я^  Ъ^  °® Ўю  ’ю  ѓю  }n  wn  Hю ю  Ж-iЭ ЭЇЬ;LЗKjЫюК’К&КєЙ]Щх€і(A(я'“ЗQ''Н&‹&I&6Г5Ђ5%ґ¤Nd $К#bѓУћraТъqЅСЂСaтEYз@ д      1  -@у

Добавлено спустя 13 минут, 2 секунды
PS это маленький кусочек файла. в ручную отсеивать не реал...
знакомая сказала что может помочь скрипт
Код:
findstr "+7.......... 8.........." d:\1.txt > d:\2.txt

но он ничего не дал.
мне нужно что бы из этого всего хлама, в файле 1.тхт сохранились только телефоны формата 89ххххххххх или +79ххххххххх в файл 2.тхт
Добавлено спустя 23 минуты, 57 секунд
ПС пробовал то что ты посоветовал и вот резалт
Код:
amonra@telecom$  cat 1.txt | egrep [0-9]{11} > numbers.txt
amonra@telecom$ cat numbers.txt
Binary file (standard input) matches

Добавлено спустя 49 секунд
ничего не понял из этого :insane:
Добавлено спустя 20 минут, 45 секунд
ps

при написании cat 1.txt | egrep --text [0-9]{11} > numbers.txt
получается подобный мусор, но в меньшем количестве и так же теряются телефоны

_________________
use processor on default :)


 

Member
Статус: Не в сети
Регистрация: 01.04.2005
Откуда: Москва-Лубянка
Вот тебе на скорую руку программка..

http://cp.people.overclockers.ru/cgi-bi ... e=alex.rar

запускать так — alex yourfile > numbers.txt

Если ты мне дашь кусочек файла в бинарном виде, я и имена скорее всего вытащу :)

Alex999999 писал(а):
пробовал то что ты посоветовал

Ну, это была в большой степени шутка.. egrep, как и findstr, ищет строки, а не отдельные вхождения, причем в тексте, а не в бинарнике.. можешь попробовать egrep --text -o, впрочем..

_________________
AnossovPavel в проекте F@H (TSC!Russia)
退屈な祖父 ¤ παππούς ¤ («клан дедов»)


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 4 
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 18


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan