假设我有一个很大的对象列表(数千或数万),每个对象都带有一些标签。 有数十或数百个可能的标签,它们的使用遵循典型的幂律: 有些标签使用得非常频繁,但大多数很少见。 事实上,除了最常见的几十个标签之外,所有标签通常都可以忽略。
现在的问题是如何可视化这些标签之间的关系。 标签云只是它们频率的一个很好的可视化,但它忽略了哪些标签与其他标签一起出现。 假设标签 :bar 只出现在也被标记为 :foo 的对象上。 这在视觉上应该是显而易见的。 对于往往一起出现的三个标签也是如此。
您可以将每个标签设为气泡,并让它们部分重叠。
从技术上讲,这是一个维恩图,但以这种方式处理它可能很笨拙。
例如,Google 图表可以创建维恩图,但只能用于 3 个或更少的集合(标签):
http://code.google.com/apis/chart/docs/gallery/venn_charts.html
他们将其限制为 3 套的原因是,它看起来太可怕了。
请参阅维基百科页面上的“对更多集合的扩展”:http://en.wikipedia.org/wiki/Venn_diagrams
但这只是在每个可能的交叉点都非空的情况下。 如果不超过 3 个标签同时出现(可能在丢弃稀有标签之后),则可以使用一组维恩图(气泡的大小代表标签频率)。
或者可能是一个图形(如顶点和边),具有视觉上较粗或较细的边以表示共现频率。
您对工具或库有任何想法或建议吗? 理想情况下,我会使用 javascript 执行此操作,但我对 R 和 Mathematica 或其他任何东西持开放态度。 如果有人好奇,我很乐意分享一些实际数据(如果我告诉你它代表什么你会笑)。
附录:我最初想到的申请是TagTime但我突然想到,这也很好地映射到可视化一个人的美味书签的问题。
最佳答案
如果我正确理解您的问题,图像矩阵 应该可以很好地发挥作用。我想到的实现是一个 n x m 矩阵,其中标记的项目是行,每个标记类型是一个单独的列。矩阵中的每个单元格都将完全由“1”和“0”组成,即特定项目要么具有给定标签,要么没有。
在下面的矩阵中(我旋转了 90 度,以便它更适合这个窗口——所以列实际上代表标记的项目,每一行显示所有项目中给定标签的存在与否),我模拟了有 8 个标签 和 200 个标签项 的场景。 ,“0”是蓝色,“1”是浅黄色。
这个矩阵中的所有值都是随机选择的(每个标记的项目是从一个盒子中抽取八次,盒子由两个标记组成,一个蓝色和一个黄色(分别没有标签和标签)。所以毫不奇怪,没有视觉证据表明模式在这里,但如果您的数据中有一个,这种实现起来非常简单的技术可以帮助您找到它。
我使用 R 生成和绘制模拟数据,仅使用基础图形(没有外部包或库):
# create the matrix
A = matrix(data=r1, nrow=1, ncol=8)
# populate it with random data
for (i in seq(0, 200, 1)){r1 = sample(0:1, 8, replace=TRUE); A = rbind(A, r1)}
# now plot it
image(z=A, ann=F, axes=F, col=topo.colors(12))
关于javascript - 数据可视化 : Bubble charts, 维恩图和标签云(天哪!),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3224494/
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
我试图使用yard记录一些Ruby代码,尽管我所做的正是所描述的here或here#@param[Integer]thenumberoftrials(>=0)#@param[Float]successprobabilityineachtrialdefinitialize(n,p)#initialize...end虽然我仍然得到这个奇怪的错误@paramtaghasunknownparametername:the@paramtaghasunknownparametername:success然后生成的html看起来很奇怪。我称yard为:$yarddoc-mmarkdown我做错了什么?
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
我即将开始一个将录制和编辑音频文件的项目,我正在寻找一个好的库(最好是Ruby,但会考虑Java或.NET以外的任何库)以进行实时可视化波形。有人知道我应该从哪里开始搜索吗? 最佳答案 要流入浏览器的数据量很大。Flash或Flex图表可能是唯一能提高内存效率的解决方案。Javascript图表往往会因大型数据集而崩溃。 关于ruby-Ruby中的波形可视化,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.c
我有一个div,它根据表单是否正确提交而改变。我想知道是否可以检查类的特定元素?开始元素看起来像这样。如果输入不正确,添加错误类。 最佳答案 试试这个:browser.div(:id=>"myerrortest").class_name更多信息:http://watir.github.com/watir-webdriver/doc/Watir/HTMLElement.html#class_name-instance_method另一种选择是只查看具有您期望的类的div是否存在browser.div((:id=>"myerrortes
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_
无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD
本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01 客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02 数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co
我正在尝试在Rails上安装ruby,到目前为止一切都已安装,但是当我尝试使用rakedb:create创建数据库时,我收到一个奇怪的错误:dyld:lazysymbolbindingfailed:Symbolnotfound:_mysql_get_client_infoReferencedfrom:/Library/Ruby/Gems/1.8/gems/mysql2-0.3.11/lib/mysql2/mysql2.bundleExpectedin:flatnamespacedyld:Symbolnotfound:_mysql_get_client_infoReferencedf