Redis 模块和阻塞命令
如何在 Redis 模块中实现阻塞命令
Redis 的内置命令集包含一些阻塞命令。最常用的命令之一是 BLPOP
(或对称的 BRPOP
),它会阻塞等待列表中的元素到达。
关于阻塞命令的一个有趣事实是,它们不会阻塞整个服务器,而只会阻塞调用它们的客户端。通常阻塞的原因是我们期望发生一些外部事件:这可以是 Redis 数据结构的某些变化,如 BLPOP
的情况,线程中发生的长时间计算,接收来自网络的数据等等。
Redis 模块也能够实现阻塞命令,本文档将展示 API 的工作原理,并描述一些可用于构建阻塞命令的模式。
阻塞和恢复的工作原理。
注意:您可能想查看 Redis 源代码树中 src/modules
目录下的 helloblock.c
示例,以获取关于如何应用阻塞 API 的简单易懂的示例。
在 Redis 模块中,命令由回调函数实现,当用户调用特定命令时,Redis 核心会调用这些函数。通常,回调函数会通过向客户端发送回复来终止执行。而使用以下函数,实现模块命令的函数可以请求将客户端置于阻塞状态
RedisModuleBlockedClient *RedisModule_BlockClient(RedisModuleCtx *ctx, RedisModuleCmdFunc reply_callback, RedisModuleCmdFunc timeout_callback, void (*free_privdata)(void*), long long timeout_ms);
该函数返回一个 RedisModuleBlockedClient
对象,该对象随后用于解除客户端的阻塞。参数含义如下
ctx
是命令执行上下文,与其他 API 一样。reply_callback
是一个回调函数,与普通命令函数具有相同的原型,当客户端解除阻塞时调用,以便向客户端返回回复。timeout_callback
是一个回调函数,与普通命令函数具有相同的原型,当客户端达到ms
超时时调用。free_privdata
是用于释放私有数据的回调函数。私有数据是指一个数据指针,该数据在用于解除客户端阻塞的 API 与向客户端发送回复的回调函数之间传递。我们将在本文档后面看到此机制的工作原理。ms
是以毫秒为单位的超时时间。当达到超时时间时,将调用超时回调函数,并且客户端将自动中止。
客户端一旦被阻塞,可以使用以下 API 解除阻塞
int RedisModule_UnblockClient(RedisModuleBlockedClient *bc, void *privdata);
该函数以先前调用 RedisModule_BlockClient()
返回的阻塞客户端对象作为参数,并解除客户端的阻塞。在客户端解除阻塞之前,会立即调用阻塞客户端时指定的 reply_callback
函数:此函数将有权访问此处使用的 privdata
指针。
重要提示:上述函数是线程安全的,可以在执行某些工作的线程中调用,以实现阻塞客户端的命令。
当客户端解除阻塞时,将使用 free_privdata
回调自动释放 privdata
数据。这非常有用,因为在客户端超时或断开与服务器的连接的情况下,回复回调函数可能永远不会被调用,因此由外部函数负责在需要时释放传递的数据非常重要。
为了更好地理解 API 的工作原理,我们可以设想编写一个命令,该命令会阻塞客户端一秒钟,然后发送“Hello!”作为回复。
注意:此命令未实现参数个数检查和其他不重要的事情,以便示例简单易懂。
int Example_RedisCommand(RedisModuleCtx *ctx, RedisModuleString **argv,
int argc)
{
RedisModuleBlockedClient *bc =
RedisModule_BlockClient(ctx,reply_func,timeout_func,NULL,0);
pthread_t tid;
pthread_create(&tid,NULL,threadmain,bc);
return REDISMODULE_OK;
}
void *threadmain(void *arg) {
RedisModuleBlockedClient *bc = arg;
sleep(1); /* Wait one second and unblock. */
RedisModule_UnblockClient(bc,NULL);
}
上述命令会尽快阻塞客户端,并生成一个线程,该线程将等待一秒钟并解除客户端的阻塞。让我们检查回复和超时回调函数,在我们的示例中,它们非常相似,因为它们只是使用不同的回复类型回复客户端。
int reply_func(RedisModuleCtx *ctx, RedisModuleString **argv,
int argc)
{
return RedisModule_ReplyWithSimpleString(ctx,"Hello!");
}
int timeout_func(RedisModuleCtx *ctx, RedisModuleString **argv,
int argc)
{
return RedisModule_ReplyWithNull(ctx);
}
回复回调函数仅将“Hello!”字符串发送给客户端。这里的重点是,当客户端从线程解除阻塞时,会调用回复回调函数。
超时命令返回 NULL
,这通常发生在实际 Redis 阻塞命令超时时。
解除阻塞时传递回复数据
上面的示例易于理解,但缺少实际阻塞命令实现的一个重要现实方面:回复函数通常需要知道要回复给客户端什么,而这些信息通常在客户端解除阻塞时提供。
我们可以修改上面的示例,以便线程在等待一秒钟后生成一个随机数。您可以将其视为某种实际的昂贵操作。然后可以将此随机数传递给回复函数,以便将其返回给命令调用者。为了实现此功能,我们按如下方式修改函数
void *threadmain(void *arg) {
RedisModuleBlockedClient *bc = arg;
sleep(1); /* Wait one second and unblock. */
long *mynumber = RedisModule_Alloc(sizeof(long));
*mynumber = rand();
RedisModule_UnblockClient(bc,mynumber);
}
如您所见,现在解除阻塞调用会将一些私有数据,即 mynumber
指针,传递给回复回调函数。为了获取此私有数据,回复回调函数将使用以下函数
void *RedisModule_GetBlockedClientPrivateData(RedisModuleCtx *ctx);
因此,我们的回复回调函数修改如下
int reply_func(RedisModuleCtx *ctx, RedisModuleString **argv,
int argc)
{
long *mynumber = RedisModule_GetBlockedClientPrivateData(ctx);
/* IMPORTANT: don't free mynumber here, but in the
* free privdata callback. */
return RedisModule_ReplyWithLongLong(ctx,mynumber);
}
请注意,在使用 RedisModule_BlockClient()
阻塞客户端时,我们还需要传递一个 free_privdata
函数,因为必须释放分配的长整型值。我们的回调函数将如下所示
void free_privdata(void *privdata) {
RedisModule_Free(privdata);
}
注意:重要的是要强调,私有数据最好在 free_privdata
回调函数中释放,因为如果客户端断开连接或超时,可能不会调用回复函数。
另请注意,私有数据也可从超时回调函数访问,始终使用 GetBlockedClientPrivateData()
API。
中止客户端的阻塞
有时出现的一个问题是,我们需要分配资源来实现非阻塞命令。因此,我们阻塞客户端,然后,例如,尝试创建一个线程,但线程创建函数返回错误。在这种情况下,为了恢复,该怎么办?我们不想让客户端保持阻塞状态,也不想调用 UnblockClient()
,因为这会触发回复回调函数被调用。
在这种情况下,最好的办法是使用以下函数
int RedisModule_AbortBlock(RedisModuleBlockedClient *bc);
实际使用方法如下
int Example_RedisCommand(RedisModuleCtx *ctx, RedisModuleString **argv,
int argc)
{
RedisModuleBlockedClient *bc =
RedisModule_BlockClient(ctx,reply_func,timeout_func,NULL,0);
pthread_t tid;
if (pthread_create(&tid,NULL,threadmain,bc) != 0) {
RedisModule_AbortBlock(bc);
RedisModule_ReplyWithError(ctx,"Sorry can't create a thread");
}
return REDISMODULE_OK;
}
客户端将被解除阻塞,但回复回调函数不会被调用。
使用单个函数实现命令、回复和超时回调
可以使用以下函数,以便使用实现主要命令函数的同一函数来实现回复和回调
int RedisModule_IsBlockedReplyRequest(RedisModuleCtx *ctx);
int RedisModule_IsBlockedTimeoutRequest(RedisModuleCtx *ctx);
因此,我可以重写示例命令,而不使用单独的回复和超时回调函数
int Example_RedisCommand(RedisModuleCtx *ctx, RedisModuleString **argv,
int argc)
{
if (RedisModule_IsBlockedReplyRequest(ctx)) {
long *mynumber = RedisModule_GetBlockedClientPrivateData(ctx);
return RedisModule_ReplyWithLongLong(ctx,mynumber);
} else if (RedisModule_IsBlockedTimeoutRequest) {
return RedisModule_ReplyWithNull(ctx);
}
RedisModuleBlockedClient *bc =
RedisModule_BlockClient(ctx,reply_func,timeout_func,NULL,0);
pthread_t tid;
if (pthread_create(&tid,NULL,threadmain,bc) != 0) {
RedisModule_AbortBlock(bc);
RedisModule_ReplyWithError(ctx,"Sorry can't create a thread");
}
return REDISMODULE_OK;
}
功能上是一样的,但有些人更喜欢不太冗长的实现,因为它将大部分命令逻辑集中在一个函数中。
在线程内部处理数据副本
使用线程实现命令慢速部分的有趣模式是处理数据副本,这样当对某个键执行某些操作时,用户仍然会看到旧版本。然而,当线程完成其工作时,表示会被交换,并使用新的、已处理的版本。
此方法的一个示例是 Neural Redis 模块,其中神经网络在不同的线程中进行训练,而用户仍然可以执行和检查它们的旧版本。
未来工作
目前正在开发一个 API,以允许从线程安全地调用 Redis 模块 API,从而使线程化命令可以访问数据空间并执行增量操作。
此功能没有预计完成时间 (ETA),但可能会在 Redis 4.0 版本发布期间的某个时候出现。