资讯详情

redis3_redis数据类型

写在前面

个人博客网站:https://jiong952.github.io/ 个人github网址:https://github.com/jiong952

五大数据类型

redis命令操作大全

http://www.redis.cn/commands.html

redis键-key操作

  • keys *查看当前库的所有权key (匹配:keys *1)

img

  • exists key判断某个key是否存在

  • type key 查看你的key是什么类型

  • del key 删除指定的key数据 【先斩后奏】

  • unlink key 根据value选择非阻塞删除 【先奏后斩】

    • 仅将keys从keyspace删除元数据,真实删除将在后续异步操作。
  • expire key 10 10秒:给定key设置过期时间

  • ttl key 检查还有多少秒过期,-1表示永远不会过期,-2表示已过期

  • select命令切换数据库 【一共有16个 一般默认

  • dbsize查看当前数据库key的数量

【少用】

  • flushdb清空当前库
  • flushall通杀全部库

  1. 字符串类型 string
  2. 哈希类型 hash : map格式
  3. 列表类型 list : linkedlist格式。支持重复元素
  4. 集合类型 set : 不允许重复元素
  5. 有序集合类型 sortedset:不允许重复元素,元素有序

字符串类型 string

String是Redis你可以理解最基本的类型Memcached一模一样的类型,一key对应一个value。

String二进制安全。这意味着Redis的string可以包含任何数据。jpg图片或序列对象。

二进制安全是一种计算机编程术语,主要用于与字符串操作函数相关的计算机编程术语。二进制安全功能(函数)本质上将操作输入作为没有任何特殊格式意义的原始数据流。公平对待每个字符,不处理特定字符。

大多数函数使用任何特殊或标记字符,如转义码和期望 null 最后的字符串(如C语言中的字符串)并不安全。一个可能的例外是,函数的明确目的是在二进制字符串中搜索特定字符。

C语言中的字符串是基于特殊字符\0判断字符串是否结束,对于字符串str="0123456789\在C语言中,0123456789str的长度就是10(strlen(str)=10),所以strlen()函数不是二进制安全的。而在Redis中,strlen str结果是21,二进制安全(Redis底层使用的字符串表示Sds),它只关心二进制字符串,不关心字符串的具体格式,里面有什么字符,只严格按照二进制数据访问,不会以特殊格式分析字符串。

String类型是Redis最基本的数据类型,一个Redis中字符串value最多可以是512M

set 添加键值对 【参数】

  • setNX【setnx】:当数据库中key不存在的时候,可以把key-value添加数据库

    • setNX k1 v1000
  • setEX【setex】:key的超时秒数 SETEX key seconds value

    • setEX k2 10 v200 设置值同时设置过期时间

get

查询对应键值

append

将给定的 追加到原值的末尾

strlen

获得值的长度

incr

将 key 中存储的数字值增加1

只能操作数字值,如果为空,新增值为1

decr

将 key 中存储的数字值减1

只能操作数字值,如果为空,新增值为-1

incrby / decrby <步长>

将 key 存储在中间的数字值增减。

mset …

同时设置一个或多个 key-value对

mget …

同时获得一个或多个 value

msetnx …

同时设置一个或多个 key-value 是的,只有当所有给定key 都不存在。

所谓操作是指不被线程调度机制打断的操作;

这种操作一旦开始,就会一直运行到结束,中间不会有任何东西context switch (切换到另一个线程)。

(1)在单线程中,可以在单个指令中完成的操作可以认为是"原子操作",因为中断只能发生在指令之间。

(2)在多线程中,不能被其他过程(线程)中断的操作称为原子操作。

Redis单命令的原子性主要得益于Redis的单线程。

java没有原子性【多线程】

案例:i=两个线程分别对i 100次值是多少?2-200

getrange <起始位置><结束位置>

获得值的范围相似java中的substring,

setrange <起始位置>

用 从<起始位置>开始()。

getset

以新换旧,设置了新值同时获得旧值。

String数据结构

String简单动态字符串的数据结构(Simple Dynamic String,缩写SDS)。可修改的字符串与内部结构相似Java的ArrayList,预分配冗余空间以减少内存的频繁分配.

如图所示,当前字符串实际分实际分配的空间capacity一般高于实际字符串长度len。当字符串长度小于1时M扩容是现有空间的两倍,如果超过1M,扩容一次只会扩大1M需要注意的是,字符串的最大长度是512M。

哈希类型 hash

Redis hash 是键值对集。

Redis hash是一个string类型的field和value的映射表,hash特别适用于存储对象。 类似Java里面的Map<String,Object>

用户ID为查找的key,存储的value如果使用普通信息,用户对象包括姓名、年龄、生日等信息key/value结构来存储

td>
【key】user:1000【value】{id=1,name=zhangsan,age=30} 每次需要修改用户的属性时,都要先反序列化,然后序列化回去。成本更高。 user:1000:id 1user:1000:name zhangsanuser:1000:age 30用户ID数据冗余

标签)

hset 【新建或增加 给filed赋值 单个或多个 也可以修改】

hset 给集合中的 键赋值

  • hset user id 1 name zhang age 30 【新建】
  • hset user id 2 gender man 【修改id 新增gender】

hmset 【赋值 多个】

hmset … 批量设置hash的值

hget 【取值 单个】

hget 从集合取出 value

hmget 【取值多个】

hget …从集合取出 value

hexists 【判断存在】

hexists查看哈希表 key 中,给定域 field 是否存在。

hkeys 【获取所有filed】

hkeys 列出该hash集合的所有field

hkeys 【获取所有value】

hvals 列出该hash集合的所有value

hgetall 【获取所有filed 和value】

hgetall 列出该hash集合的所有filed和value

hincrby 【指定增加某整数值】

hincrby 为哈希表 key 中的域 field 的值加上增量 1 -1

hsetnx 【不存在filed时增加】

hsetnx 将哈希表 key 中的域 field 的值设置为 value ,当且仅当域 field 不存在 .

数据结构

Hash类型对应的数据结构是两种:ziplist(压缩列表),hashtable(哈希表)。当field-value长度较短且个数较少时,使用ziplist,否则使用hashtable。

列表类型 list

单键多值

Redis 列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)。

它的底层实际是个双向链表,对两端的操作性能很高,通过索引下标的操作中间的节点性能会较差。

lpush/rpush 插入

lpush/rpush … 从左边/右边插入一个或多个值。

lpop/rpop 弹出

lpop/rpop 从左边/右边弹出一个值并删除。所有值都删除键就删除

rpoplpush 从a右边弹出插入b左边

rpoplpush 从列表右边吐出一个值,插到列表左边。

lrange 获得值

lrange

按照索引下标获得元素(从左到右)

lrange mylist 0 -1 0左边第一个,-1右边第一个,(0-1表示获取所有)

lindex 【获得某下标的值】

lindex 按照索引下标获得元素(从左到右)

llen 【长度】

llen 获得列表长度

linsert 【指定位置插入】

linsert before/after 在的后面插入插入值

lrem【删除从左边数n个值】

lrem 从左边删除n个value(从左到右)

lset 【替换某下标值】

lset将列表key下标为index的值替换成value

数据结构

List的数据结构为快速链表quickList。

首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。

当数据量比较多的时候才会改成quicklist。

因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是int类型的数据,结构上还需要两个额外的指针prev和next。

Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。

https://blog.csdn.net/zgaoq/article/details/89710600

集合类型 set : 不允许重复元素

Redis set对外提供的功能与list类似是一个列表的功能,特殊之处在于set是可以的,当你需要存储一个列表数据,又不希望出现重复数据时,set是一个很好的选择,并且set提供了判断某个成员是否在一个set集合内的重要接口,这个也是list所不能提供的。

Redis的Set是string类型的无序集合。它底层其实是一个value为null的hash表,所以添加,删除,查找的复杂度都是O(1)。

一个算法,随着数据的增加,执行时间的长短,如果是O(1),数据增加,查找数据的时间不变

sadd 【添加 新增】

sadd …

将一个或多个 member 元素加入到集合key 中,已经存在的member 元素将被忽略 【没有key则新建 有则追加】

smembers 【取值】

smembers 取出该集合的所有值。

sismember 【判断包含】

sismember 判断集合是否为含有该值,有1,没有0

scard 【长度】

scard返回该集合的元素个数。

srem 【删除一个或多个】

srem … 删除集合中的某个元素。

spop 【随机弹出一个值并删除】

spop 随机从该集合中吐出一个值。

srandmember 【随机弹出n个值 不删除】

srandmember 随机从该集合中取出n个值。不会从集合中删除。

smove 【从a中弹出并删除值到b】

smove value把集合中一个值从一个集合移动到另一个集合

sinter 【两集合交集】

sinter 返回两个集合的交集元素。

sunion 【两集合并集】

sunion 返回两个集合的并集元素。

sdiff【两集合差集 含a不含b】

sdiff 返回两个集合的元素(key1中的,不包含key2中的)

数据结构

Set数据结构是dict字典,字典是用哈希表实现的。

Java中HashSet的内部实现使用的是HashMap,只不过所有的value都指向同一个对象。Redis的set结构也是一样,它的内部也使用hash结构,所有的value都指向同一个内部值null。

有序集合类型 sortedset(zset)

Redis有序集合zset与普通集合set非常相似,是一个没有重复元素的字符串集合。

不同之处是有序集合的每个成员都关联了一个,这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复了。

因为元素是有序的, 所以你也可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。

访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表。

zadd 【新建或增加一个或多个】

zadd …

将一个或多个 member 元素及其score 值加入到有序集key 当中。

zrange 【取值】

zrange [WITHSCORES]

  • 返回有序集 key 中,下标在 之间的元素
  • 带WITHSCORES,可以让分数一起和值返回到结果集。

zrangebyscore 【取评分在范围内的值 从小到大返回】

zrangebyscore key minmax [withscores] [limit offset count]

返回有序集 key 中,所有score 值介于min 和max 之间(包括等于min 或max )的成员。有序集成员按score 值递增(从小到大)次序排列。

zrevrangebyscore【取评分在范围内的值 从大到小返回】

zrevrangebyscore key maxmin [withscores] [limit offset count]

同上,改为从大到小排列。

zincrby 【给元素加分】

zincrby 为元素的score加上增量

zrem 【删除 一个或多个】

zrem 删除该集合下,指定值的元素

zcard 【返回集合大小】

zcard key

zcount 【返回指定分数区间内集合大小】

zcount 统计该集合,分数区间内的元素个数

zrank 【返回某元素的排名】

zrank 返回该值在集合中的排名,从0开始。

数据结构

SortedSet(zset)是Redis提供的一个非常特别的数据结构,一方面它等价于Java的数据结构Map<String, Double>,可以给每一个元素value赋予一个权重score,另一方面它又类似于TreeSet,内部的元素会按照权重score进行排序,可以得到每个元素的名次,还可以通过score的范围来获取元素的列表。

zset底层使用了两个数据结构

  1. hash,hash的作用就是关联元素value和权重score,保障元素value的唯一性,可以通过元素value找到相应的score值。
  2. 跳跃表,跳跃表的目的在于给元素value排序,根据score的范围获取元素列表。

跳跃表

有序集合在生活中比较常见,例如根据成绩对学生排名,根据得分对玩家排名等。对于有序集合的底层实现,可以用数组、平衡树、链表等。数组不便元素的插入、删除;平衡树或红黑树虽然效率高但结构复杂;链表查询需要遍历所有效率低。Redis采用的是跳跃表。跳跃表效率堪比红黑树,实现远比红黑树简单。

实例

对比有序链表和跳跃表,从链表中查询出51

(1) 有序链表

要查找值为51的元素,需要从第一个元素开始依次查找、比较才能找到。共需要6次比较。

(2) 跳跃表

从第2层开始,1节点比51节点小,向后比较。

21节点比51节点小,继续向后比较,后面就是NULL了,所以从21节点向下到第1层

在第1层,41节点比51节点小,继续向后,61节点比51节点大,所以从41向下

在第0层,51节点为要查找的节点,节点被找到,共查找4次。

https://blog.csdn.net/qq_24047659/article/details/88042998?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522164847319116782248585070%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=164847319116782248585070&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaiduend~default-2-88042998.142v5pc_search_result_control_group,143v6control&utm_term=%E8%B7%B3%E8%B7%83%E8%A1%A8&spm=1018.2226.3001.4187

Bitmap

现代计算机用二进制(位)作为信息的基础单位, 1个字节等于8位,例如“abc”字符串是由3个字节组成,但实际在计算机存储时将其用二进制表示,“abc”分别对应的ASCII码分别是97、98、99,对应的二进制分别是01100001、 01100010和01100011,如下图

合理地使用操作位能够有效地提高内存使用率和开发效率。

​ Redis提供了Bitmaps这个“数据类型”可以实现对位的操作:

  1. Bitmaps本身不是一种数据类型,实际上它就是字符串(key-value),但是它可以对字符串的位进行操作。
  2. Bitmaps单独提供了一套命令,所以在Redis中使用Bitmaps和使用字符串的方法不太相同。可以把Bitmaps想象成一个以位为单位的数组,数组的每个单元只能存储0和1,数组的下标在Bitmaps中叫做偏移量。

setbit【设置】

setbit 设置Bitmaps中某个偏移量的值(0或1)

  • *offset:偏移量从0开始

实例-用户访问记录

每个独立用户是否访问过网站存放在Bitmaps中,将访问的用户记做1,没有访问的用户记做0,用偏移量作为用户的id。

设置键的第offset个位的值(从0算起),假设现在有20个用户,userid=1, 6, 11, 15, 19的用户对网站进行了访问,那么当前Bitmaps初始化结果如图

很多应用的用户id以一个指定数字(例如10000)开头,直接将用户id和Bitmaps的偏移量对应势必会造成一定的浪费,通常的做法是每次做setbit操作时将用户id减去这个指定数字。

在第一次初始化Bitmaps时,假如偏移量非常大,那么整个初始化过程执行会比较慢,可能会造成Redis的阻塞。

getbit【取值】

getbit获取Bitmaps中某个偏移量的值

获取键的第offset位的值(从0开始算)

实例-用户访问记录

获取id=8的用户是否在2020-11-06这天访问过,返回0说明没有访问过:

注:因为100根本不存在,所以也是返回0

bitcount【统计1总数 可以指定区间】

统计被设置为1的bit数。一般情况下,给定的整个字符串都会被进行计数。

通过指定额外的 start 或 end 参数,可以让计数只在特定的位上进行。start 和 end 参数的设置,都可以使用负数值 注意:start和end表示的是字节 即 8位

比如 -1 表示最后一个位,而 -2 表示倒数第二个位,start、end 是指bit组的字节的下标数,二者皆包含。

实例-用户访问统计

start和end代表起始和结束字节数,下面操作计算用户id在第1个字节到第3个字节之间的独立访问用户数,对应的用户id是11, 15, 19。

注意:redis的setbit设置或清除的是bit位置,而bitcount计算的是byte位置。

bitop 【复合操作 交并差补】

bitop and(or/not/xor) [key…]

bitop是一个复合操作,它可以做多个Bitmaps的and(交集)、or(并集)、 not(非)、 xor(异或)操作并将结果保存在destkey中。

实例-统计用户

2020-11-04 日访问网站的userid=1,2,5,9。setbit unique:users:20201104 1 1setbit unique:users:20201104 2 1setbit unique:users:20201104 5 1setbit unique:users:20201104 9 1 2020-11-03 日访问网站的userid=0,1,4,9。setbit unique:users:20201103 0 1setbit unique:users:20201103 1 1setbit unique:users:20201103 4 1setbit unique:users:20201103 9 1

计算出两天都访问过网站的用户数量

使用and操作——统计两天都访问的用户

BITOP AND unique:users:and:20201104_03 unique:users:20201103 unique:users:20201104

计算用户活跃量

  • 使用or操作
  • 计算出任意一天都访问过网站的用户数量(例如月活跃就是类似这种),可以使用or求并集

假设网站有1亿用户,每天独立访问的用户有5千万,如果每天用集合类型和Bitmaps分别存储活跃用户可以得到表

set和Bitmaps存储一天活跃用户对比
数据类型 每个用户id占用空间 需要存储的用户量 全部内存量
集合类型 64位 50000000 64位*50000000 = 400MB
Bitmaps 1位 100000000 1位*100000000 = 12.5MB

很明显,这种情况下使用Bitmaps能节省很多的内存空间,尤其是随着时间推移节省的内存还是非常可观的

set和Bitmaps存储独立用户空间对比
数据类型 一天 一个月 一年
集合类型 400MB 12GB 144GB
Bitmaps 12.5MB 375MB 4.5GB

但Bitmaps并不是万金油,假如该网站每天的独立访问用户很少,例如只有10万(大量的僵尸用户),那么两者的对比如下表所示,很显然,这时候使用Bitmaps就不太合适了,因为基本上大部分位都是0。

set和Bitmaps存储一天活跃用户对比(独立用户比较少)
数据类型 每个userid占用空间 需要存储的用户量 全部内存量
集合类型 64位 100000 64位*100000 = 800KB
Bitmaps 1位 100000000 1位*100000000 = 12.5MB

应用场景

  • 统计用户周活跃

    • 最后计算7天内登录过的活跃用户
  • 查询用户在线状态

  • 用户签到

HyperLogLog 【基数统计】

在工作当中,我们经常会遇到与统计相关的功能需求,比如统计网站PV(PageView页面访问量),可以使用Redis的incr、incrby轻松实现。

但像UV(UniqueVisitor,独立访客)、独立IP数、搜索记录数等需要去重和计数的问题如何解决?这种求集合中不重复元素个数的问题称为基数问题。

什么是基数?

比如数据集 {1, 3, 5, 7, 5, 7, 8},那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内,快速计算基数。

用于解决基数问题

解决基数问题有很多种方案:

  1. 数据存储在MySQL表中,使用distinct count计算不重复个数
  2. 使用Redis提供的hash、set、bitmaps等数据结构来处理

以上的方案结果精确,但随着数据不断增加,导致占用空间越来越大,对于非常大的数据集是不切实际的。

能否能够降低一定的精度来平衡存储空间?Redis推出了HyperLogLog

Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。

在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。

但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素。

只能统计数量,不能返回元素

pfadd【添加】

pfadd < element> [element …] 添加指定元素到 HyperLogLog 中

pfcount【返回数量】

pfcount [key …] 计算HLL的近似基数,可以计算多个HLL,

  • 比如用HLL存储每天的UV,计算一周的UV可以使用7天的UV合并计算即可

pfmerge【合并多个HLL】

pfmerge [sourcekey …] 将一个或多个HLL合并后的结果存储在另一个HLL中

  • 比如每月活跃用户可以使用每天的活跃用户来合并计算可得

Redis 3.2 中增加了对GEO类型的支持。GEO,Geographic,地理信息的缩写。该类型,就是元素的2维坐标,在地图上就是经纬度。redis基于该类型,提供了经纬度设置,查询,范围查询,距离查询,经纬度Hash等常见操作。

geoadd 【添加地理位置】

geoadd< longitude> [longitude latitude member…] 添加地理位置(经度,纬度,名称)

  • geoadd china:city 121.47 31.23 shanghai
  • geoadd china:city 106.50 29.53 chongqing 114.05 22.52 shenzhen 116.38 39.90 beijing
  1. 两极无法直接添加,一般会下载城市数据,直接通过 Java 程序一次性导入。
  2. 有效的经度从 -180 度到 180 度。有效的纬度从 -85.05112878 度到 85.05112878 度。
  3. 当坐标位置超出指定范围时,该命令将会返回一个错误。
  4. 已经添加的数据,是无法再次往里面添加的。【去重,但是添加相同可以修改】

geopos 【取值】

geopos [member…] 获得指定地区的坐标值

  • GEOPOS china:city shanghai

geodist【获取两位置之间的直线距离】

geodist [m|km|ft|mi ] 获取两个位置之间的直线距离

单位:

  • m 表示单位为米[默认值]。
  • km 表示单位为千米。
  • mi 表示单位为英里。
  • ft 表示单位为英尺。

如果用户没有显式地指定单位参数,那么 GEODIST 默认使用米作为单位

georadius【取出周围的元素】

georadius< longitude>radius m|km|ft|mi 以给定的经纬度为中心,找出某一半径内的元素

  • GEORADIUS china:city 100 30 1000 km

标签: 16v1000直插铝电解电容

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台