Bilibili API library for Kotlin
Go to file
2018-02-04 23:37:00 +08:00
record/bullet_screen_stream_json 使用 Netty 重新实现 LiveClient, 使用 guava EventBus 来作为事件机制实现 2018-01-31 10:38:53 +08:00
src 更新备注. 现在 LiveService.getPlayUrl 时如果没有指定 otype, 将返回一个空 JsonArray 2018-02-04 23:37:00 +08:00
.gitignore 将 .gradle 加入到 gitignore 2018-01-24 10:49:07 +08:00
build.gradle 格式化代码 2018-02-02 17:35:56 +08:00
LICENSE 编写 readme 2017-11-07 16:48:53 +08:00
README.md 实现带验证码的登录 2018-02-02 14:39:33 +08:00
settings.gradle 使用 Gradle 2018-01-19 17:23:01 +08:00

Bilibili API 调用库

该项目提供 Bilibili API 的 Java 调用, 协议来自 Bilibili Android APP 的逆向工程以及截包分析.

由于B站即使更新客户端, 也会继续兼容以前的旧版本客户端, 所以短期内不用担心 API 失效的问题.

注意, 该项目使用 Bilibili Android 客户端协议, 与 Web 端的协议有差异, 不要提交 Web 端有关的 API.

API 不完全

由于本项目还在开发初期, 大量 API 没有完成, 所以很可能没有你想要的 API.

欢迎提交 issue 或者 Merge Request.

添加依赖

Gradle

compile group: 'com.hiczp', name: 'bilibili-api', version: '0.0.2'

Maven

<dependency>
  <groupId>com.hiczp</groupId>
  <artifactId>bilibili-api</artifactId>
  <version>0.0.2</version>
</dependency>

名词解释

B站不少参数都是瞎取的, 并且不统一, 经常混用, 以下给出一些常见参数对应的含义

参数 含义
mid 用户 ID(与 userId 含义一致, 经常被混用)
userId 用户 ID, 用户在B站的唯一标识, 数字
userid 注意这里是全小写, 它的值可能是 'bili_1178318619', 这个东西是没用的, B站并不用这个作为用户唯一标识
showRoomId 直播间 URL (Web)上的房间号
roomId 直播间的真实 ID(直播房间号在 1000 以下的房间, 真实 ID 是另外一个数字)
cid 直播间 ID(URL 上的房间号以及真实房间号都叫 cid)
ruid 直播间房主的用户 ID

使用

RESTFul API

由于B站 API 设计清奇, 一些显然不需要登录的 API 也需要登录, 所以所有 API 尽可能登陆后访问以免失败.

登录

使用账户名和密码作为登录参数

BilibiliAPI bilibiliAPI = new BilibiliAPI()
    .login(String username, String password) throws IOException, LoginException

IOException 在网络故障时抛出

LoginException 在用户名密码不匹配时抛出

CaptchaMismatchException 在验证码不正确时抛出, 见下文 验证码问题 一节

login 方法的返回值为 LoginResponseEntity 类型, 使用

.login(...).toBilibiliAccount()

来获得一个 BilibiliAccount 实例, 其中包含了 OAuth2 的用户凭证, 如果有需要, 可以将其持久化保存.

将一个登陆状态恢复出来(从之前保存的 BilibiliAccount 实例)使用如下代码

BilibiliAPI bilibiliAPI = new BilibiliAPI(BilibiliAccount bilibiliAccount)

注意, 如果这个 BilibiliAccount 实例含有的 accessToken 是错误的或者过期的, 需要鉴权的 API 将全部 401.

刷新 Token

OAuth2 的重要凭证有两个, token 与 refreshToken, token 到期之后, 并不需要再次用用户名密码登录一次, 仅需要用 refreshToken 刷新一次 token 即可(会得到新的 token 和 refreshToken, refreshToken 的有效期不是无限的. B站的 refreshToken 有效期不明确).

bilibiliAPI.refreshToken() throws IOException, LoginException

IOException 在网络故障时抛出

LoginException 在 token 错误,或者 refreshToken 错误或过期时抛出.

登出

BilibiliRESTAPI.logout() throws IOException, LoginException

IOException 在网络故障时抛出

LoginException 在 accessToken 错误或过期时抛出

验证码问题

当对一个账户在短时间内(时长不明确)尝试多次错误的登录(密码错误)后, 再尝试登录该账号, 会被要求验证码.

此时登录操作会抛出 CaptchaMismatchException 异常, 表示必须调用另一个接口

public LoginResponseEntity login(String username,
                                 String password,
                                 String captcha,
                                 String cookie) throws IOException, LoginException, CaptchaMismatchException

这个接口将带 captcha 参数地去登录, 注意这里还有一个 cookie 参数.

下面先给出一段正确使用该接口的代码, 随后会解释其步骤

String username = "yourUsername";
String password = "yourPassword";
BilibiliAPI bilibiliAPI = new BilibiliAPI();
try {
    bilibiliAPI.login(username, password);
} catch (CaptchaMismatchException e) {  //如果该账号现在需要验证码来进行登录, 就会抛出异常
    final cookie = "sid=123456";    //自己造一个 cookie 或者从服务器取得
    Response response = bilibiliAPI.getPassportService()
            .getCaptcha(cookie)
            .execute();
    InputStream inputStream = response.body().byteStream();
    String captcha = letUserInputCaptcha(inputStream);  //让用户根据图片输入验证码
    bilibiliAPI.login(
        username,
        password,
        captcha,
        cookie
    );
}

验证码是通过访问 https://passport.bilibili.com/captcha 这个地址获得的.

访问这个地址需要带有一个 cookie, cookie 里面要有 "sid=xxx", 然后服务端会记录下对应关系, 也就是 sid xxx 对应验证码 yyy, 然后就可以验证了.

我们会发现, 访问任何 passport.bilibili.com 下面的地址, 都会被分发一个 cookie, 里面带有 sid 的值. 我们访问 /captcha 也会被分发一个 cookie, 但是这个通过访问 captcha 而被分发得到的 cookie 和访问得到的验证码图片, 没有对应关系. 推测是因为 cookie 的发放在请求进入甚至模块运行完毕后才进行.

所以我们如果不带 cookie 去访问 /captcha, 我们这样拿到的由 /captcha 返回的 cookie 和 验证码, 是不匹配的.

所以我们要先从其他地方获取一个 cookie.

我们可以用 /api/oauth2/getKey(获取加密密码用的 hash 和公钥) 来获取一个 cookie

String cookie = bilibiliAPI.getPassportService()
    .getKey()
    .execute()
    .headers()
    .get("Set-cookie");

/captcha 不验证 cookie 正确性, 我们可以直接使用假的 cookie (比如 123456)对其发起验证码请求, 它会记录下这个假的 cookie 和 验证码 的对应关系, 一样能验证成功. 但是不推荐这么做.

简单地说, 只要我们是带 cookie 访问 /captcha 的, 那么我们得到的验证码, 是和这个 cookie 绑定的. 我们接下去用这个 cookie 和 这个验证码的值 去进行带验证码的登录, 就可以成功登陆.

至于验证码怎么处理, 可以显示给最终用户, 让用户来输入, 或者用一些预训练模型自动识别验证码.

这个带验证码的登录接口也会继续抛出 CaptchaMismatchException, 如果验证码输入错误的话.

API 调用示例

打印一个直播间的历史弹幕

int roomId = 3;
new BilibiliAPI()
    .getLiveService()
    .getHistoryBulletScreens(roomId)
    .execute()
    .body()
    .getData()
    .getRoom()
    .forEach(liveHistoryBulletScreenEntity ->
        System.out.printf("[%s]%s: %s\n",
            liveHistoryBulletScreenEntity.getTimeline(),
            liveHistoryBulletScreenEntity.getNickname(),
            liveHistoryBulletScreenEntity.getText())
    );

发送一条弹幕到指定直播间

String username = "yourUsername";
String password = "yourPassword";
int roomId = 3;

BilibiliAPI bilibiliAPI = new BilibiliAPI()
    .login(username, password);

bilibiliAPI.getLiveService()
    .sendBulletScreen(
        new BulletScreenEntity(
                roomId,
                bilibiliAPI.getBilibiliAccount().getUserId(),   //实际上并不需要包含 mid 就可以正常发送弹幕, 但是真实的 Android 客户端确实发送了 mid
                "这是自动发送的弹幕"
        )
    ).execute();

(如果要调用需要鉴权的 API, 需要先登录)

API 文档

//TODO 文档编写中

Socket

获取直播间实时弹幕

int roomId = 3;
LiveClient liveClient = new BilibiliAPI()
    .getLiveClient(roomId)
    .registerListener(new MyListener())
    .connect();

.connect() 会抛出 IOException 当网络故障时.

(connect 以及 close 方法都是阻塞的)

使用 .getLiveClient() 前可以先登录也可以不登陆直接用, 如果 API 已经登录, 那么进房数据包中会带有用户ID, 尚不明确有什么作用, 可能与一些统计有关.

(connect 方法运行结束只代表 socket 确实是连上了, 但是服务器还没有响应进房请求数据包)

(当服务器响应进房请求数据包时才代表真的连上了, 此时会有一个连接成功的事件, 见下文)

事件机制使用 Google Guava EventBus 实现, 监听器不需要继承任何类或者接口.

public class MyListener {
    @Subscribe
    public void onConnectSucceed(ConnectSucceedEvent connectSucceedEvent) {
        //do something
    }
    
    @Subscribe
    public void onConnectionClose(ConnectionCloseEvent connectionCloseEvent) {
        //do something
    }
    
    @Subscribe
    public void onDanMuMsg(DanMuMsgPackageEvent danMuMsgPackageEvent) {
        DanMuMsgEntity danMuMsgEntity = danMuMsgPackageEvent.getDanMuMsgEntity();
        System.out.pintf("%s: %s\n", danMuMsgEntity.getUsername(), danMuMsgEntity.getMessage());
    }
}

如果持续 40 秒(心跳包为 30 秒)没有收到任何消息, 将视为掉线, 会跟服务器主动断开连接一样(这通常是发送了服务器无法读取的数据包)触发一次 ConnectionCloseEvent.

liveClient.close();

即可关闭连接.

所有的事件(有些数据包我也不知道它里面的一些值是什么含义, /record 目录下面有抓取到的 Json, 可以用来查看):

事件 抛出条件
ActivityEventPackageEvent 收到 ACTIVITY_EVENT 数据包
ConnectionCloseEvent 连接断开(主动或被动)
ConnectSucceedEvent 进房成功
DanMuMsgPackageEvent 收到 DANMU_MSG 数据包
LivePackageEvent 收到 LIVE 数据包
PreparingPackageEvent 收到 PREPARING 数据包
SendGiftPackageEvent 收到 SEND_GIFT 数据包
SysGiftPackageEvent 收到 SYS_GIFT 数据包
SysMsgPackageEvent 收到 SYS_MSG 数据包
UnknownPackageEvent B站新增了新种类的数据包, 出现此情况请提交 issue
ViewerCountPackageEvent 收到 房间人数 数据包(不是 Json)
WelcomeGuardPackageEvent 收到 WELCOME_GUARD 数据包
WelcomePackageEvent 收到 WELCOME 数据包

事件里面可以取到解析好的 POJO, 然后可以从里面取数据, 见上面的监听器示例.

特别说明

直播间 ID 问题

一个直播间, 我们用浏览器去访问它, 他可能是这样的

http://live.bilibili.com/3

我们可能会以为后面的 3 就是这个直播间的 room_id, 其实并不是.

我们能直接看到的这个号码, 其实是 show_room_id.

所有直播间号码小于 1000 的直播间, show_room_id 和 room_id 是不相等的(room_id 在不少 API 里又叫 cid).

一些 API 能提供自动跳转功能, 也就是用这个 show_room_id 作为参数, 返回的信息是跳转到对应的 room_id 之后的返回信息.

简单地说, 一些 API 用 show_room_id 作为参数可以正常工作, 而另一些不能. 所以尽可能使用 room_id 作为参数来调用 API.

room_id 的获取要通过

http://api.live.bilibili.com/AppRoom/index?room_id=3&platform=android

其中, response.data.room_id 就是其真实的 room_id, 例子中的这个直播间的真实 room_id 为 23058

在代码中我们这样做

int showRoomId = 3;
int roomId = bilibiliAPI.getLiveService()
                .getRoomInfo(showRoomId)
                .execute()
                .body()
                .getData()
                .getRoomId();

由此, 我们获得了直播间的真实 room_id, 用它访问其他 API 就不会出错了.

服务器返回非 0 返回值时

当服务器返回的 JSON 中的 code 字段非 0 时(有错误发生), 该 JSON 可能是由服务端过滤器统一返回的, 因此其 JSON 格式(字段类型)将和实体类不一样, 此时会导致 JsonParseErrorException.

为了让调用代码不需要写很多 try catch, 因此当服务器返回的 code 非 0 时, 封装好的 OkHttpClientInterceptor 将把 data 字段变为 null(发生错误时, data 字段没有实际有效的数据).

因此只需要判断 code 是否是 0 即可知道 API 是否成功执行, 不需要异常捕获.

(B站所有 API 无论是否执行成功, HttpStatus 都是 200, 判断 HTTP 状态码是无用的, 必须通过 JSON 中的 code 字段来知道 API 是否执行成功).

License

GPL V3