Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 53 • Страница 3 из 3<  1  2  3
  Версия для печати (полностью) Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 28.10.2007
erazel
Мне кажется бред. Если в html тупо засунуть <,> через спец символы, то они тоже примитивно отсекаются. Или через тэг кода - то ещё проще.
В любом случае - вывод на монитор побольше, фотка и файнридер. Элементарно.
Так что если человек сможет текст прочитать, то и скопировать - нет проблем. Вне зависимости от объема.



Партнер
 

Member
Статус: Не в сети
Регистрация: 09.04.2006
erazel писал(а):
moty а все же как вы собираетесь отсекать теги от обычного текста? Отличие тега в том что он идет после < и до > но стоит эти два символа кинуть в текст как парсинг и затупит на том елементе. Базу тегов тоже не создашь так как их слишком много и они все разные. Вот и получаеться что если автор текса знает что его будут парсить то может наделать слишком много подлянок.



Цитата:
а все же как вы собираетесь отсекать теги от обычного текста?


Ненененене, ответьте мне лучше, какой это смысл отвечать что-то человеку, который даже не умеет пользоваться гуглом? А это вообще убило..:
Цитата:
Базу тегов тоже не создашь так как их слишком много и они все разные

:lol: :weep:

_________________
Библиотеки Windows - Мы заставим ваши папки тормозить!


 

Member
Статус: Не в сети
Регистрация: 11.03.2009
Откуда: Санкт-Петербург
Как уже говорили, можно делать текст в виде фоток, но тогда он во-первых, не будет индексироваться поисковиками, а во-вторых, от файнридера опять же не защитит.
Так что лучшая защита текста - капча: :tooth:
#77

_________________
Личная коллекция видеокарт на http://vccollection.ru/
Команда star-citizen.ru. Самые свежие материалы о Star Citizen.


 

Member
Статус: Не в сети
Регистрация: 28.10.2007
H_Rush
Угу, и динамическая капча, да так чтобы цифры через вычисления, а буквы через ребусы.
А к одинаковой капче можно и поднаписать, если очень надо =)


 

Member
Статус: Не в сети
Регистрация: 13.06.2009
Откуда: Костромская обл
Кому очень сильно понадобится и в ручную с картинки спишут текст в тхт :haha:

_________________
i5-2500K, GA-Z68XP-UD4, Corsair Vengeance 1600, ICE HAMER 4600N
GTX560ti HAWK, Seagate 250Гб ,WD1тб+WD1тб, SONY DVD-RW, Thermaltake 650w, GW2450HM


 

Member
Статус: Не в сети
Регистрация: 25.01.2006
Откуда: Тернополь(Укр.)
moty писал(а):
Ненененене, ответьте мне лучше, какой это смысл отвечать что-то человеку, который даже не умеет пользоваться гуглом? А это вообще убило..:

А если без лишних понтов и на конкретных примерах? Хотя бы в виде логики работы скрипта? Кидаться умными фразами каждый может. То что по шаблону можна вычислить тег это ясно, но шаблон можна легко обманунуть. Вот как вы собираетесь отсекать теги от отбычного текста? По каким критериям вы будете определять текс это или тег?

_________________
Жизнь коротка, апгрейд вечен


 

Member
Статус: Не в сети
Регистрация: 09.04.2006
erazel писал(а):
moty писал(а):
Ненененене, ответьте мне лучше, какой это смысл отвечать что-то человеку, который даже не умеет пользоваться гуглом? А это вообще убило..:

А если без лишних понтов и на конкретных примерах? Хотя бы в виде логики работы скрипта? Кидаться умными фразами каждый может. То что по шаблону можна вычислить тег это ясно, но шаблон можна легко обманунуть. Вот как вы собираетесь отсекать теги от отбычного текста? По каким критериям вы будете определять текс это или тег?


цикл
Eсли <
Можно начать записывать в переменную маску удаления любого вида и любой сложности.
Регулярка на валидность тега (латиница, макс символов, макс допустимые символы, пробел )
если невалиден - брейк.
// необязательно
быстренькое сравнение с листом тегов.
если невалиден - брейк
// конец необязательного.
редактирование
цикл с регуляркой для выявления параметров тега. регулярка проверяет правописание пары название параметра - значение.
//необязательное:
1. сравнение допустимости заголовков параметров с листом всех параметров.
2. проверка всех возможных значений параметров по регулярке.
3. запись маски.
// конец необязательного.
поиск >
дополнение маски
Удаление по маске.
Дальше, пока не еоф.



Такой скрипт удалит весь валидный html. Т.е. например из "важная информация <font color="vazhnaja_informacija">инф </font></invalid_tag>" можно получить "важная информация vazhnaja_informacijaинф </invalid_tag>" Можно там... реализовать удаление даже незакрытых тегов - делать всё, пока валидные параметры не сменятся на кашу остального текста.... проверять ессно регуляркой :)
Опытный программист может тотально изменить алгоритм, и вообще сделать всё по другому.
Но вообще это глупость, ибо инструмент, который не только отделяет валидный html от невалидного, но и использует его - браузер.

_________________
Библиотеки Windows - Мы заставим ваши папки тормозить!


Последний раз редактировалось moty 21.11.2010 22:32, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 27.05.2007
erazel писал(а):
А если без лишних понтов и на конкретных примерах?

жизненный пример- текстовый редактор с подсветкой html тегов
у него же как то получается отделять их от остального текста...
а если даже не знать регулярные выражения, а просто погуглить то практически первая ссылка выведет на
выражение вида (<.*?>), которое и должно в большинстве случаев соответствовать html тегам, если в тексте нет извращений.


 

Member
Статус: Не в сети
Регистрация: 09.04.2006
ДуччЧ писал(а):
выражение вида (<.*?>), которое и должно в большинстве случаев соответствовать html тегам, если в тексте нет извращений.


Не, имелись ввиду именно извращения типа "что парсер сделает если посреди текста будет знак "меньше чем"".

_________________
Библиотеки Windows - Мы заставим ваши папки тормозить!


 

Member
Статус: Не в сети
Регистрация: 25.01.2006
Откуда: Тернополь(Укр.)
Сенкс, moty.
Вот именно это я и хотел увидеть.
Цитата:
быстренькое сравнение с листом тегов.

Я вот про это говорил что тегов слишком много и всех может в базе небыть. Хотя еще неясно какую базу тегов использовать. А вообще есть база тегов? :-) Ну может какие-то спецификации HTML 5.x и все такое.

_________________
Жизнь коротка, апгрейд вечен


 

Member
Статус: Не в сети
Регистрация: 06.10.2008
Откуда: Тула, Н-ск
Фото: 5
erazel берётся студент второкурсник, 500р и 2 дня, через 2 дня вы получаете чистый голый текст без тегов, ещё и форматированный. От юзверя не спасает никакая защита, так что не морочьтесь с этим даже. Если не хотите, чтобы текст копировали, не выкладывайте его в свободный доступ.

_________________
Пятнадцать человек на сундук мертвеца,
Йо-хо-хо, и бутылка рому!
Пей, и дьявол тебя доведет до конца.
Йо-хо-хо, и бутылка рому!


 

Member
Статус: Не в сети
Регистрация: 08.06.2008
Откуда: Kyiv, UA
Никак. Ибо вариантов скопировать тьма. Правда на счет удаления тегов не соглашусь, при кривой разметке (которая как ни странно будет нормально отображаться), можно встретить что нить вроде <div><div <span>some text</span></div> и поди потом разбирай такое. Количество открывающих и закрывающих тегов на некоторых сайтах не совпадает.


 

Member
Статус: Не в сети
Регистрация: 09.04.2006
erazel писал(а):
Я вот про это говорил что тегов слишком много и всех может в базе небыть. Хотя еще неясно какую базу тегов использовать. А вообще есть база тегов? :-) Ну может какие-то спецификации HTML 5.x и все такое.


Есть чёткие стандарты, как html должен выглядеть, какие теги в нём должны быть теги, а какие нет, стандарты ставит World Wide Web Consortium W3, они в скучных документациях описывают каждый байт стандартов, иначе-бы каждый сайт писался-бы на "своём" языке и отобразить его в браузере было-бы невозможно. Ну а тегов не так уж много http://www.w3schools.com/tags/default.asp в 5-м добавилось.

Цитата:
при кривой разметке (которая как ни странно будет нормально отображаться), можно встретить что нить вроде <div><div <span>some text</span></div>

я писал:
Цитата:
Можно там... реализовать удаление даже незакрытых тегов - делать всё, пока валидные параметры не сменятся на кашу остального текста.... проверять ессно регуляркой

_________________
Библиотеки Windows - Мы заставим ваши папки тормозить!


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 53 • Страница 3 из 3<  1  2  3
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot], Gromwerg, Vik321 и гости: 22


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan