От автора: Urllib — это модуль Python, который можно использовать для открытия URL-адресов. Он определяет функции и классы для обработки URL-адресов.
С помощью Python вы также можете получать и получать данные из Интернета, такие как XML, HTML, JSON и т. д. Вы также можете использовать Python для непосредственной работы с этими данными. В этом руководстве мы рассмотрим, как можно получать данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99, и мы собираемся получить доступ к этому URL-адресу видео с помощью Python, а также вывести HTML-файл этого URL-адреса.
В этом руководстве мы рассмотрим:
Как открыть URL с помощью Urllib
Как в Python прочитать HTML-файл для URL-адреса
Как открыть URL с помощью Urllib
Перед тем, как запустить код для подключения к интернет-данным, нам импортировать модуль библиотеки URL или «urllib».
Импортируем urllib
Определяем основную функцию
Объявляем переменную webUrl
Затем вызываем функцию urlopen в библиотеке urllib
URL, который мы открываем — это руководство guru99 по YouTube
Далее мы собираемся вывести код результата
Код результата получается путем вызова функции getcode для созданной нами переменной webUrl
Мы собираемся преобразовать это в строку, чтобы ее можно было объединить со строкой «код результата»
Это будет обычный HTTP-код «200», указывающий, что http-запрос успешно обработан
Как в Python получить URL-адрес HTML-файла
Вы также можете прочитать файл HTML, используя «функцию чтения», и когда вы запустите код, файл HTML отобразится в консоли.
Вызовите функцию read для переменной webURL
Переменная Read позволяет читать содержимое файлов данных.
Считать все содержимое URL-адреса в переменную с именем data
Запустите код — он выведет данные в формате HTML
Вот полный код:
Пример Python 2
# # читаем данные с URL-адреса и выводим их # import urllib2 def main(): # открываем соединение к URL-адресу с помощью urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #получаем код результата и выводим его print "result code: " + str(webUrl.getcode()) # читаем данные с URL-адреса и выводим их data = webUrl.read() print data if __name__ == "__main__": main()
Пример Python 3
# # читаем данные с URL-адреса и выводим их # import urllib.request # открываем соединение к URL-адресу с помощью urllib2 webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') # получаем код результата и выводим его print ("result code: " + str(webUrl.getcode())) # читаем данные с URL-адреса и выводим их data = webUrl.read() print (data)
Источник: https://www.guru99.com
Редакция: Команда webformyself.