ZetCode

Ruby Faraday 教程

最后修改于 2023 年 1 月 10 日

在本教程中,我们将介绍如何使用 Ruby Faraday 模块。我们将获取数据、发布数据、处理 JSON,并连接到安全的网页。我们还将创建一个自定义的 Faraday 中间件。本教程使用 Sinatra 应用程序进行了一些示例。ZetCode 还有一个简洁的Ruby 教程

超文本传输协议 (HTTP) 是一种用于分布式、协作式、超媒体信息系统的应用协议。HTTP 是万维网数据通信的基础。

Ruby Faraday 是一个简单、灵活的 HTTP 客户端库,支持多种后端。Faraday 也是一个中间件。

$ sudo gem install faraday

该模块使用 sudo gem install faraday 命令安装。

Sinatra

Sinatra 是一个流行的 Ruby Web 应用程序框架。它易于安装和设置。我们的一些示例也将使用 Sinatra 应用程序。

$ sudo gem install sinatra
$ sudo gem install thin

我们安装 Sinatra 和 Thin Web 服务器。如果安装了 Thin,Sinatra 会自动选择 Thin 而不是默认的 WEBrick 服务器。

$ pwd
/home/janbodnar/prog/sinatra/first
$ ls
main.rb

在第一个目录中,我们有一个 main.rb 文件,它是 Sinatra 应用程序文件。

main.rb
require 'sinatra'

get '/' do
    "First application"
end

该应用程序响应 / 路由。它将一个简单的消息发送回客户端。

$ ruby main.rb 
== Sinatra (v1.4.7) has taken the stage on 4567 for development with backup from Thin
Thin web server (v1.6.4 codename Gob Bluth)
Maximum connections set to 1024
Listening on localhost:4567, CTRL+C to stop

应用程序通过 ruby main.rb 命令启动。Thin 服务器将被启动;它监听 4567 端口。

$ curl localhost:4567/
First application

使用 curl 命令行工具,我们连接到服务器并访问 / 路由。控制台会显示一条消息。

版本

第一个 Faraday 程序打印库和 Ruby 语言的版本。

version.rb
#!/usr/bin/ruby

require 'faraday'

puts Faraday::VERSION
puts Faraday::default_adapter

这两个常量提供了库版本号和默认的 Faraday 适配器。

$ ./version.rb 
0.9.2
net_http

这是字符串的示例输出。

获取内容

get 方法获取由给定 URL 标识的文档。

get_content.rb
#!/usr/bin/ruby

require 'faraday'

res = Faraday.get 'http://www.something.com' 

puts res.body

该脚本抓取 www.something.com 网页的内容。

$ ./get_content.rb 
<html><head><title>Something.</title></head>
<body>Something.</body>
</html>

这是 get_content.rb 脚本的输出。

以下程序获取一个小型网页并去除其 HTML 标签。

strip_tags.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday::Connection.new "http://www.something.com"

res = con.get

puts res.body.gsub(%r{</?[^>]+?>}, '')

该脚本剥离了 www.something.com 网页的 HTML 标签。

puts res.body.gsub(%r{</?[^>]+?>}, '')

使用一个简单的正则表达式来去除 HTML 标签。

$ ./strip_tags.rb 
Something.
Something.

该脚本打印网页的标题和内容。

状态

Faraday::Responsestatus 方法返回响应的 HTTP 状态码。

status.rb
#!/usr/bin/ruby

require 'faraday'

res = Faraday.get 'http://www.something.com'  
puts res.status
puts res.success?

res = Faraday.get 'http://www.something.com/news/'
puts res.status
puts res.success?

res = Faraday.get 'http://www.urbandicionary.com/define.php?term=Dog'
puts res.status
puts res.success?

我们使用 get 方法执行三个 HTTP 请求,并检查返回的状态。

res = Faraday.get 'http://www.something.com'  
puts res.status

HTTP 响应的状态通过 status 方法进行检查。

puts res.success?

success? 方法指示状态码是否成功。

$ ./status.rb 
200
true
404
false
302
false

200 是成功 HTTP 请求的标准响应,404 表示找不到请求的资源,302 表示资源被暂时重定向。

head 方法

head 方法检索文档头信息。头信息由字段组成,包括日期、服务器、内容类型或最后修改时间。

head.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday.new :url => "http://www.something.com"

res = con.head 

puts res.headers['server']
puts res.headers['date']
puts res.headers['last-modified']
puts res.headers['content-type']
puts res.headers['content-length']

该示例打印 www.something.com 网页的服务器、日期、最后修改时间、内容类型和内容长度。

$ ./head.rb 
Apache/2.4.12 (FreeBSD) OpenSSL/1.0.1l-freebsd mod_fastcgi/mod_fastcgi-SNAP-0910052141
Tue, 10 May 2016 10:19:01 GMT
Mon, 25 Oct 1999 15:36:02 GMT
text/html
77

这是 head.rb 程序的输出。

get 方法

get 方法向服务器发出 GET 请求。GET 方法请求指定资源的表示形式。

main.rb
require 'sinatra'

get '/greet' do  
    "Hello #{params[:name]}"
end

这是 Sinatra 应用程序文件。在收到 /greet 路由后,它会返回一条包含客户端发送的名称的消息。

mget.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday.new 

res = con.get 'https://:4567/greet', { :name => 'Peter' }

puts res.body   

该脚本将一个带有值的变量发送到 Sinatra 应用程序。该变量直接在 URL 中指定。

$ ./mget.rb 
Hello Peter

这是示例的输出。

127.0.0.1 - - [10/May/2016:22:04:38 +0200] "GET /greet?name=Peter HTTP/1.1" 200 11 0.0034

在 Thin 服务器的此日志中,我们可以看到参数已被编码到 URL 中。

get 方法接受第二个参数,我们可以在其中指定查询参数。

mget2.rb
#!/usr/bin/ruby

require 'faraday'

res = Faraday.get do |req|
    req.url 'https:///greet' 
    req.params['name']  = 'Jan' 
end

puts res.body  

这是发出 GET 消息的另一种方式。

$ ./mget2.rb 
Hello Peter

这是示例的输出。

用户代理

在本节中,我们指定了用户代理的名称。

main.rb
require 'sinatra'

get '/agent' do
    request.user_agent
end

Sinatra 应用程序返回客户端发送的用户代理。

agent.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday.new 

res = con.get do |req| 
    req.url 'https://:4567/agent' 
    req.headers['User-Agent'] = 'Ruby script'
end

puts res.body

此脚本向 Sinatra 应用程序创建了一个简单的 GET 请求。

res = con.get do |req| 
    req.url 'https://:4567/agent' 
    req.headers['User-Agent'] = 'Ruby script'
end

用户代理在请求的 headers 属性中指定。

$ ./agent.rb 
Ruby script

服务器响应了我们随请求发送的代理名称。

发布一个值

post 方法在给定的 URL 上分派一个 POST 请求,为表单填写内容提供键/值对。

main.rb
require 'sinatra'

post '/target' do
    "Hello #{params[:name]}"
end

Sinatra 应用程序在 /target 路由上返回问候语。它从 params 哈希中获取值。

mpost.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday.new 'https://'

res = con.post '/target', { :name => 'Jan' }

puts res.body

该脚本发送一个带有 name 键、值为 Jan 的请求。POST 请求使用 post 方法发出。

$ ./mpost.rb 
Hello Jan

这是 mpost.rb 脚本的输出。

127.0.0.1 - - [11/May/2016:13:49:44 +0200] "POST /target HTTP/1.1" 200 9 0.0006

使用 POST 方法时,值不会发送在请求 URL 中。

从字典中检索定义

在接下来的示例中,我们在 www.dictionary.com 上查找一个术语的定义。为了解析 HTML,我们使用了 nokogiri gem。可以使用 sudo gem install nokogiri 命令安装它。

get_term.rb
#!/usr/bin/ruby

require 'faraday'
require 'nokogiri'

term = 'dog'
con = Faraday.new :url => 'http://www.dictionary.com/browse/'+term

res = con.get 

doc = Nokogiri::HTML res.body
doc.css("div.def-content").map do |node|
    s = node.text.strip!
    s.gsub!(/\s{3,}/, " ") unless (s == nil)
    puts s unless (s == nil)
end

在此脚本中,我们在 www.dictionary.com 上查找术语 dog 的定义。Nokogiri::HTML 用于解析 HTML 代码。

con = Faraday.new :url => 'http://www.dictionary.com/browse/'+term

要执行搜索,我们将术语附加到 URL 的末尾。

doc = Nokogiri::HTML res.body
doc.css("div.def-content").map do |node|
    s = node.text.strip!
    s.gsub!(/\s{3,}/, " ") unless (s == nil)
    puts s unless (s == nil)
end

我们使用 Nokogiri::HTML 类解析内容。定义位于 <div class="def-content"> 标签内。我们通过删除多余的空白来改进格式。

JSON

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它易于人类阅读和编写,也易于机器解析和生成。

$ sudo gem install json

如果我们之前没有安装 json gem,我们需要安装它。

main.rb
require 'sinatra'
require 'json'

get '/example.json' do
    content_type :json
    { :name => 'Jane', :age => 17 }.to_json
end

Sinatra 应用程序发送 JSON 数据。它使用 to_json 方法来完成此操作。

parse_json.rb
#!/usr/bin/ruby

require 'faraday'
require 'json'
 
con = Faraday.new :url => 'https://:4567/example.json'
  
res = con.get
data = JSON.parse res.body

puts data["name"]
puts data["age"]

该示例读取 Sinatra 应用程序发送的 JSON 数据。

$ ./parse_json.rb 
Jane
17

这是示例的输出。

接下来,我们从 Ruby 脚本向 Sinatra 应用程序发送 JSON 数据。

main.rb
require 'sinatra'
require 'json'

post '/readjson' do
    data = JSON.parse request.body.read
    puts data
    "#{data["name"]} is #{data["age"]} years old"
end

此应用程序读取 JSON 数据并发送回包含解析值的消息。

post_json.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday.new 

res = con.post do |req|
    req.url 'https://:4567/readjson'
    req.headers['Content-Type'] = 'application/json'
    req.body = '{ "name": "Jane", "age": 17 }'
end

puts res.body

此脚本向 Sinatra 应用程序发送 JSON 数据并读取其响应。

req.headers['Content-Type'] = 'application/json'

请求中必须指定 'application/json' 内容类型。

$ ./post_json.rb 
Jane is 17 years old

这是示例的输出。

凭据

basic_auth 方法设置用于域的用户名和密码。安全域是用于保护 Web 应用程序资源的机制。

$ sudo gem install sinatra-basic-auth

对于此示例,我们需要安装 sinatra-basic-auth gem。

main.rb
require 'sinatra'
require "sinatra/basic_auth"

authorize do |username, password|
    username == "user7" && password == "7user"
end

get '/' do
    "hello"
end

protect do
    get "/secure" do
        "This is restricted area"
    end
end

在 Sinatra 应用程序中,我们指定了授权逻辑并设置了一个受保护的路由。

credentials.rb
#!/usr/bin/ruby

require 'faraday'

con = Faraday.new :url => 'https:///secure/'

user = 'user7'
passwd = '7user'

con.basic_auth  user, passwd
res = con.get 

puts res.body

该脚本连接到受保护的网页;它提供访问该页面所需的用户名和密码。

$ ./credentials.rb 
This is restricted area

使用正确的凭据,credentials.rb 脚本将返回受限制的数据。

Faraday 中间件

中间件 是连接两个独立应用程序的软件。除了作为 HTTP 客户端,Faraday 还充当中介。这个概念与 Ruby Rack 非常相似。

Faraday::Connection 包含一个中间件列表。Faraday 中间件接收一个 env 哈希,其中包含请求和响应信息。中间件可以在请求执行之前和之后操纵这些信息。

重定向

重定向是将一个 URL 转发到另一个 URL 的过程。HTTP 响应状态码 302 用于临时 URL 重定向。

重定向实现在 Faraday 的一个中间件模块中。

$ sudo gem install faraday_middleware

这些模块在 faraday_middleware gem 中可用。

main.rb
require 'sinatra'

get "/oldpage" do  
    redirect to("/files/newpage.html"), 302
end

在 Sinatra 应用程序中,我们使用 redirect 命令重定向到另一个位置。

newpage.html
<!DOCTYPE html>
<html>
<head>
<title>New page</title>
</head>
<body>
<p>
This is a new page
</p>
</body>
</html>

这是位于 public/files 子目录中的 newpage.html 文件。

redirect.rb
#!/usr/bin/ruby

require 'faraday'
require 'faraday_middleware'

con = Faraday.new 'https://:4567/oldpage' do |con|
    con.use FaradayMiddleware::FollowRedirects, limit: 5
    con.adapter Faraday.default_adapter
end

res = con.get
puts res.body

此脚本访问旧页面并跟随重定向。

$ ./redirect.rb 
<!DOCTYPE html>
<html>
<head>
<title>New page</title>
</head>
<body>
<p>
This is a new page
</p>
</body>
</html>

这是示例的输出。

127.0.0.1 - - [10/May/2016:22:14:16 +0200] "GET /oldpage HTTP/1.1" 302 - 0.0199
127.0.0.1 - - [10/May/2016:22:14:16 +0200] "GET /files/newpage.html HTTP/1.1" 200 113 0.0073

从日志中我们可以看到请求被重定向到了新的文件名。通信包括两个 GET 请求。

MyLogger

在接下来的示例中,我们将创建自己的小型中间件。它实现了请求和响应日志记录。

main.rb
require 'sinatra'

get '/greet' do  
    "Hello #{params[:name]}"
end

这是一个 Sinatra 应用程序,它向客户端发送问候语。

logger.rb
#!/usr/bin/ruby

require 'faraday'
require 'logger'

class MyLogger
    
    def initialize app
        @app = app
        @logger = Logger.new(STDOUT)
    end

    def call env
        on_request("request", env)
        @app.call(env).on_complete do
            on_response("response", env)
        end
    end

    private
    def on_request phase, env
        @logger.info("#{phase} : #{env.method} - #{env.url}") if env.method and env.url
    end
    
    private
    def on_response phase, env
        @logger.info("#{phase} : #{env.body}") if env.body 
    end    
end

con = Faraday.new(:url => "https://:4567") do |build|
    build.request :url_encoded
    build.use MyLogger
    build.adapter  Faraday.default_adapter
end

res = con.get "/greet", {'name' => 'Jan'}

这里我们创建一个实现了控制台日志记录的中间件。

def call env
    on_request("request", env)
    @app.call(env).on_complete do
        on_response("response", env)
    end
end

中间件必须实现 call 方法。它为请求和响应执行一个方法。

private
def on_request phase, env
    @logger.info("#{phase} : #{env.method} - #{env.url}") if env.method and env.url
end

在生成请求时,会调用 on_request 方法。该方法记录阶段、请求方法和 URL。

con = Faraday.new(:url => "https://:4567") do |build|
    build.request :url_encoded
    build.use MyLogger
    build.adapter Faraday.default_adapter
end

MyLogger 中间件使用 use 方法添加到堆栈中。当连接对象执行请求时,它会创建一个共享的 env 哈希,将外部中间件包装在每个内部中间件周围,并执行 call 方法。

res = con.get "/greet", {'name' => 'Jan'}

消息被发送到 Sinatra 应用程序。请求和响应被记录到终端。

$ ./logger.rb 
I, [2016-05-11T14:48:55.700198 #4945]  INFO -- : request : get - https://:4567/greet?name=Jan
I, [2016-05-11T14:48:55.706989 #4945]  INFO -- : response : Hello Jan

这是示例的输出。

在本教程中,我们学习了 Ruby Faraday 模块。ZetCode 上也有类似的Ruby HTTPClient 教程Ruby Net::HTTP 教程