Содержание
- 1 WWW (World Wide Web) — Компьютерные технологии
- 2 Единицы измерения информации. Бит. Байт.
- 3 Двоичное кодирование информации
- 4 История Всемирной паутины
- 5 Структура и принципы
- 6 Примечания
- 7 История Всемирной паутины[править | править код]
- 8 General Information
- 9 Что такое Хостинг?
- 10 Структура
- 11 Файл. Форматы файлов.
- 12 Будущее
- 13 Носители и сигналы
- 14 Способы активного отображения информации во Всемирной паутине
- 15 Проблемы
WWW (World Wide Web) — Компьютерные технологии
Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа — веб-браузер. Основная функция веб-браузера — отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссылки.
Большая часть информации в Вебе представляет из себя именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language), язык разметки гипертекста.
Технологии Всемирной паутины
В целом можно заключить, что Всемирная паутина стоит на «трёх китах»: HTTP, HTML и URL. Хотя в последнеевремя HTML начал несколько сдавать свои позиции и уступать их более современным технологиям разметки: XHTML и XML. Для улучшения визуального восприятия веба стала широко применяться технология CSS (англ. Cascading Style Sheets), которая позволяет задавать единые стили оформления для множества веб-страниц.
Популярная концепция развития Всемирной паутины — создание семантической паутины. Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров.
Семантическая паутина — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования.
Перспективы развития Всемирной паутины
В настоящее время наметились две тенденции в развитии Всемирной паутины: семантическая паутина и социальная паутина. Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных.
Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналов, OPML, микроформаты XHTML). Частично семантизированные участки Дерева категорий «Википедии» помогают пользователям осознанно перемещаться в информационном пространстве, однако, очень мягкие требования к подкатегориям не дают основания надеяться на расширение таких участков. В связи с этим интерес могут представлять попытки составления атласов Знания.
Существует также популярное понятие Web 2.0, обобщающее сразу несколько направлений развития Всемирной паутины.
Способы активного отображения информации во Всемирной паутине
Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно — тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:
- гостевые книги,
- форумы,
- чаты,
- блоги,
- wiki-проекты,
- социальные сети,
- системы управления контентом.
Следует отметить, что это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.
Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.
World Wide Web иногда иронично называют Wild Wild Web (дикий, дикий Web) — по аналогии с названием одноименного фильма Wild Wild West (Дикий, дикий Запад).
Единицы измерения информации. Бит. Байт.
Бит – наименьшая единица представления информации. Байт – наименьшая единица обработки и передачи информации.
Решая различные задачи, человек использует информацию об окружающем нас мире. Часто приходится слышать, что сообщение несет мало информации или, наоборот, содержит исчерпывающую информацию, при этом разные люди, получившие одно и то же сообщение (например, прочитав статью в газете), по-разному оценивают количество информации, содержащейся в нем. Это означает, что знания людей об этих событиях (явлениях) до получения сообщения были различными. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя. Если в результате получения сообщения достигнута полная ясность в данном вопросе (т.е. неопределенность исчезнет), говорят, что получена исчерпывающая информация. Это означает, что нет необходимости в дополнительной информации на эту тему. Напротив, если после получения сообщения неопределенность осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, информации получено не было (нулевая информация).
Подбрасывание монеты и слежение за ее падением дает определенную информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит.
Единица измерения информации называется бит (bit) – сокращение от английских слов binary digit, что означает двоичная цифра.
В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено – не намагничено, есть отверстие – нет отверстия. При этом одно состояние принято обозначать цифрой 0, а другое – цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding).
В информатике часто используется величина, называемая байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28). Наряду с байтами для измерения количества информации используются более крупные единицы:
1 Кбайт (один килобайт) = 2\up1210 байт = 1024 байта;
1 Мбайт (один мегабайт) = 2\up1210 Кбайт = 1024 Кбайта;
1 Гбайт (один гигабайт) = 2\up1210 Мбайт = 1024 Мбайта.
Например, книга содержит 100 страниц; на каждой странице – 35 строк, в каждой строке – 50 символов. Объем информации, содержащийся в книге, рассчитывается следующим образом:
Страница содержит 35 × 50 = 1750 байт информации. Объем всей информации в книге (в разных единицах):
1750 × 100 = 175 000 байт.
175 000 / 1024 = 170,8984 Кбайт.
170,8984 / 1024 = 0,166893 Мбайт.
Двоичное кодирование информации
История Всемирной паутины
Изобретателями всемирной паутины считаются Тим Бернерс-Ли и, в меньшей степени, Роберт Кайо. Тим Бернерс-Ли является автором технологий HTTP,URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. conseil européen pour la recherche nucléaire, CERN) консультантом по программному обеспечению. Именно там, в Женеве(Швейцария), он для собственных нужд написал программу «Энквайр» (англ. Enquire, можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины. В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как «Всемирная паутина». Проект подразумевал публикациюгипертекстовых документов, связанных между собойгиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.
В рамках проекта Бернерс-Ли написал первый в мире веб-сервер, называвшийся «httpd», и первый в мире гипертекстовый веб-браузер, называвшийся «WorldWideWeb». Этот браузер был одновременно и WYSIWYG-редактором (сокр. отангл. what you see is what you get — что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде NeXTStep и начала распространяться по Интернету летом 1991 года.
— Robert Cailliau, 2 ноября 1995
Первый в мире веб-сайт был размещён Бернерсом-Ли 6 августа 1991 года на первом веб-сервере доступном по адресу http://info.cern.ch/, (здесь архивная копия). Ресурс определял понятие «Всемирной паутины», содержал инструкции по установке веб-сервера, использования браузера и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.
Первая фотография во Всемирной паутине — группа Les Horribles Cernettes
На первой фотографии, появившейся во Всемирной паутине, была изображена пародийная филк-группа Les Horribles Cernettes. Тим Бернес-Ли попросил у лидера группы отсканированные фотографии после музыкального фестиваля «CERN hardronic festival».
И всё же теоретические основы веба были заложены гораздо раньше Бернерса-Ли. Ещё в 1945 году Ванна́вер Буш разработал концепцию Memex — вспомогательных механических средств «расширения человеческой памяти». Memex — это устройство, в котором человек хранит все свои книги и записи (а в идеале — и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).
С 1994 года основную работу по развитию Всемирной паутины взял на себя консорциум Всемирной паутины(англ. world wide web consortium, три буквы «W» и «C», W3C), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный консорциум — организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи консорциума — обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.
W3C разрабатывает для Интернета единые принципы и стандарты (называемые «рекомендациями», англ. W3C recommendations), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все рекомендации консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.
Структура и принципы
Всемирная паутина вокруг Википедии
Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенных по всему миру. Веб-сервер — это компьютерная программа, запускаемая на подключённом к сети компьютере и использующая протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны в ответ на HTTP-запрос динамически генерировать документы с помощью шаблонов и сценариев.
Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа — веб-браузер. Основная функция веб-браузера — отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссылки. Большая часть информации в Вебе представляет собой именно гипертекст.
Для создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language «язык разметки гипертекста»). Работа по созданию (разметке) гипертекстовых документов называется вёрсткой, она делается веб-мастером либо отдельным специалистом по разметке — верстальщиком. После HTML-разметки получившийся документ сохраняется в файл, и такие HTML-файлы являются основным типом ресурсов Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт.
Гипертекст веб-страниц содержит гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Для определения местонахождения ресурсов во Всемирной паутине используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Например, полный URL главной страницы русского раздела Википедии выглядит так: . Подобные URL-локаторы сочетают в себе технологию идентификации URI (англ. Uniform Resource Identifier «единообразный идентификатор ресурса») и систему доменных имён DNS (англ. Domain Name System). Доменное имя (в данном случае ) в составе URL обозначает компьютер (точнее — один из его сетевых интерфейсов), который исполняет код нужного веб-сервера. URL текущей страницы обычно можно увидеть в адресной строке браузера, хотя многие современные браузеры предпочитают по умолчанию показывать лишь доменное имя текущего сайта.
Примечания
- ↑
- Christey, Steve and Martin, Robert A. . MITRE Corporation (22 мая 2007). Дата обращения: 7 июня 2008.
- (PDF). Sophos (Q1 2008). Дата обращения: 24 апреля 2008.
- (PDF). Sophos (июль 2008). Дата обращения: 24 августа 2008.
- O’Reilly, Tim. 4–5. O’Reilly Media (30 сентября 2005). Дата обращения: 4 июня 2008.
- S. Lawrence, C.L. Giles, «Searching the World Wide Web, » Science, 280(5360), 98-100, 1998.
- S. Lawrence, C.L. Giles, «Accessibility of Information on the Web, » Nature, 400, 107—109, 1999.
- . Brightplanet.com. Дата обращения: 27 июля 2009.
- . Netz-tipp.de. Дата обращения: 27 июля 2009.
- Alessio Signorini. . Cs.uiowa.edu. Дата обращения: 27 июля 2009.
- . Worldwidewebsize.com. Дата обращения: 27 июля 2009.
- Alpert, Jesse; Hajaj, Nissan. . The Official Google Blog (25 июля 2008).
История Всемирной паутины[править | править код]
Так выглядит самый первый веб-сервер, разработанный Тимом Бернерс-Ли
В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.
С 1994 года основную работу по развитию Всемирной паутины взял на себя консорциум Всемирной паутины (англ. World Wide Web Consortium, W3C), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный консорциум — организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи консорциума — обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.
W3C разрабатывает для Интернета единые принципы и стандарты (называемые «рекомендациями», англ. W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все рекомендации консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.
General Information
- Talks
-
Members of the W3C team often give talks and presentations. In most cases,
you can find information and presentations on this web site contained within
the appropriate subject or activity area. This is
a collection of slides and presentations from the past several years. -
International World Wide Web
Conferences -
Information on upcoming and past World Wide Web conferences organized by
the International World Wide Web Conference Committee - Web Mailing Lists
-
How do I contact other web users? Mailing lists
maintained by the W3C and outside
the W3C - Frequently Asked Questions
-
If you can’t find it elsewhere. The World Wide Web FAQ, maintained by Thomas
Boutell
Что такое Хостинг?
Хостинг (веб-хостинг, hosting, web-hosting) — предоставление услуг размещения, поддержки и сопровождения пользовательских или корпоративных веб-сайтов на серверах специализирующихся на таких услугах компаний (хостинг-провайдеров). Лидеры этого бизнеса создают центры хранения и хостинга данных, обеспеченные резервными источниками электропитания, защитой от попадания влаги, устойчивостью к землетрясениям и т.д., что позволяет обеспечить устойчивый круглосуточный доступ к веб-сайтам клиентов. Кроме того, хостингами называют сами площадки или сервера, предоставляющие эту услугу.
Различают платный (коммерческий) и бесплатный хостинг.
Структура
Internet — глобальная компьютерная сеть, состоящая из всех видов компьютерных сетей, связанных стереотипными соглашениями о методах обмена информацией и единой адресной системой. Онлайновая единица — это локальная сеть, введение которой связано с некоторой сетью.
Серверы
Интернет-сервер — это аппаратное и программное обеспечение, которое обеспечивает работу любых необходимых интернет-сервисов: http (веб-сайт), электронная почта (электронная почта), ftp (протокол / метод передачи файлов) и т.д. Для размещения сайта в интернет требуется интернет-сервер.
Чаще всего интернет-серверы — это мощные компьютеры, оснащенные одинаковым мощным программным обеспечением, включая поддержку различных языков программирования и протоколов передачи данных, баз данных, антивирусов и других систем защиты.
Браузеры
Браузер — это мировая программа на компьютере, с поддержкой которой заходят в интернет, просматривают там информацию. Он обрабатывает данные в глобальной сети и позволяет просматривать страницы. По сути, это программа, с которой можно работать онлайн. Довольно часто иконка браузера располагается на рабочем столе компьютера. Когда нажимают на нее, появляется выход в интернет.
Гипер-ссылки
На основе ссылок сегодня происходят практически все движения на разных сайтах в интернете. Но они могут принести как пользу, так и вред
Следовательно, для пользователя важно понимать принципы работы различных типов ссылок и уметь распознавать ссылки на явно вредоносные веб-ресурсы
Гипер-текст
В общем и в упрощенном виде гипертекст представляет собой комбинацию связанных между собой совокупностей текстовых фрагментов, интегрированных в информационную систему, что позволяет пользователям переносить данные из 1-го текстового блока в другой. Оформление онлайн позволяет реализовать нелинейное чтение, в этом случае пользователь имеет возможность выбрать нужную информацию гораздо быстрее и претендовать на личную последовательность перехода от одной части слова на другую.
HTML-язык
HTML — это язык разметки гипертекста, который делает сайт таким, каким его видят пользователи. Просто благодаря этому замечательному инструменту сайты выглядят красиво и современно, а еще обеспечивают простоту использования. HTML собирает компоненты web-страницы в удобном для пользователя варианте. Его работа сравнима с тем, что на самом деле делают текстовые редакторы. Они превращают безликую массу букв в документ с шрифтом и изображениями.
Домены
Домен — это уникальная комбинация символов, которая позволяет найти сайт среди других. Помимо букв домен может содержать цифры и символы в количестве от 2 до 63. Доменное имя можно сравнить с домашним адресом. Чтобы узнать, где живет человек, нужно знать адрес проживания, то же самое касается и сайта. Каждый ресурс в Интернете имеет индивидуальный IP-адрес, который выглядит следующим образом: 195.191.24.196. Такой набор чисел очень сложно запомнить, поэтому были изобретены домены, которые визуально заменяют числовые индексы адресов.
Файл. Форматы файлов.
Будущее
World Wide Web — это система, которая еще не достигла пика своего развития. Учитывая современные технологии, все мы понимаем, насколько велико будущее Всемирной паутины. Сейчас очень много ресурсов брошено на два направления: социальное и семантическое.
Социальная паутина целиком и полностью зависит от поведения пользователей. Она развивается в соответствии с тем, как происходит упорядочивание информации в Сети.
Семантическая паутина — это направление, целью которого является улучшение релевантности запросов и связности данных. Для этого специалисты занимаются вводом новых метаданных.
Носители и сигналы
Информация будет в любом случае связана с материальным носителем. Такими носителями могут быть:
- Любые материальные предметы в виде камня, бумаги и так далее;
- Различные волны: звук, радиоволна, свет и так далее;
- Вещества в разном состоянии: температура, концентрация молекул в жидком растворе и так далее.
Сигналом называется способ передачи данных. Сигнал представляет собой физический процесс, который имеет информационное значение. Сигналы могут быть дискретными или непрерывными. Дискретный сигнал может принимать только конечное число значений в конечном числе моментов времени.
Аналоговым сигналом называется тот сигнал, который непрерывно изменяется по амплитуде и по времени. Аналоговые сигналы, как правило, используются во время телефонной связи, радиовещания и телевидения.
Сигналы, которые несут текстовую или символическую информацию, являются дискретными.
Способы активного отображения информации во Всемирной паутине
Представленная в сети информация может быть доступна:
- только для чтения («пассивно»);
- для чтения и добавления/изменения («активно»).
К способам активного отображения информации во Всемирной паутине относятся:
- гостевые книги (англ. guestbook);
- форумы (англ. forum);
- чаты (англ. chat);
- блоги (англ. blog);
- wiki-проекты;
- социальные сети (англ. social networking service);
- системы управления контентом (англ. content management system, англ. CMS).
Следует отметить, что это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.
Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.
«World wide web» иногда иронично называют «Wild wild web» («дикий, дикий web») — по аналогии с названием одноименного фильма «Wild wild west» (Дикий, дикий Запад, 1999, США).
Проблемы
Несмотря на светлое будущее World Wide Web (Internet), многое еще предстоит доработать. Например, не решенным вопросом остается безопасность. Появление Всемирной паутины стало отличной площадкой для мошенников, которые нашли путь для получения выгоды.
Киберпреступники все еще продолжают распространять вредоносное программное обеспечение. Сетевая преступность также содержит шпионаж, мошенничество, кражу личных данных и незаконный сбор информации.
Статистика оказывается очень печальной: Google утверждает, что в Интернете раз в 10 страниц попадается та, которая имеет вредоносный код. Наиболее крупные и частые кибератаки происходят со стороны легитимных ресурсов, причем большая часть из них расположена в России, Китае и США.
Наиболее частым преступлением зарегистрированы попытки злонамеренного ввода запросов к базам данных. Если сайт защищен плохо, это может стать причиной свободного доступа к БД.
Также многие пользователи страдают от межсайтового выполнения сценариев. В этом случае злоумышленник может получить данные авторизации к разным ресурсам. Например, если таким образом атаковали ваш банк, мошенники могут получить данные, которые вы позже будете вводить, чтобы получить доступ к своему личному кабинету.