对于一个项目,我需要解析一些非常大的CSV文件。一些条目的内容存储在MySQL数据库中。我正在尝试使用多线程来加快速度,但到目前为止,这只会减慢速度。我解析了一个CSV文件(最大10GB),其中一些记录(20M+记录CSV中的大约5M)需要插入到MySQL数据库中。为了确定需要插入的记录,我们使用Redis服务器和包含正确ID/引用的集合。由于我们在任何给定时间处理大约30个这样的文件,并且存在一些依赖关系,我们将每个文件存储在一个Resque队列中,并让多个服务器处理这些(优先级)队列。简而言之:classWorkerdefself.perform(file)CsvParser.ea
我的RubyonRails应用程序中有一个直接的模型,它在我的rails_admin实例中也可用。rails_admin的用户需要每天进来并上传CSV或XLS文件,并根据我将在后端呈现的一些逻辑,根据CSV/XLS中的数据创建模型实例。我不需要在文件系统上保留CSV或XLS,所以这不是问题。问题是,我不完全确定如何在rails_admin中获得一个界面,用户可以在其中上传CSV/XLS,点击上传,后端应该处理其余的事情。rails_admin是否支持这个?我可以通过它创建一个界面,我可以在其中上传文件供我的模型之一处理吗? 最佳答案
我使用的iPhone应用程序会定期通过电子邮件向我发送CSV格式的日志。我有一个ruby脚本,可以将该日志中的数据与旧日志相加。最近应用程序开发人员发布了一个更新,由于某种未知原因,在每行的末尾添加了一个回车符,导致我的脚本失败。根据文档,默认情况下:row_end应该是:auto,它应该接受\r\n或\n(在1.9.2中)。我试过将Ruby1.8.7、1.9.2和FasterCSV与1.8.7一起使用。我在这些不同的尝试中收到了各种错误消息,包括CSV::IllegalFormatError未加引号的字段不允许\r或\n(第1行)(FasterCSV::MalformedCSVE
我正在使用ActiveAdmingem,我想隐藏或删除每个模型索引页面上的链接,允许用户以CSV、XML或JSON格式下载数据。有什么办法吗? 最佳答案 index方法上现在有一个选项:download_links,因此您可以根据需要省略下载链接。例如:ActiveAdmin.registerPostdoindex:download_links=>falsedo#whateverendend 关于ruby-在ActiveAdmin中禁用CSV下载,我们在StackOverflow上找到一
我使用了spreadsheetgem去做这个。它可以工作,但有时可能会很慢。我什至尝试了Roogem,但这并没有提高性能。有没有更好的方法来完成这项工作?奇怪的是,在同一个excel中,有些工作表运行速度更快,有些工作表运行速度非常慢,甚至需要长达1小时。我们能否使用openoffice在单个excel中打开每个工作表(选项卡)并将它们更快地转换为csv?如果是,我将如何使用ruby来实现?或者有更好的解决方案吗?只是添加一个我尝试使用Roogem的小例子xls=Roo::Excel.new(source_excel_file)xls.each_with_pagenamedo|na
我正在尝试上传一个csv文件,但收到UTF-8中的无效字节序列错误。我正在使用“roo”gem。我的代码是这样的:defupload_results_csvfilespreadsheet=MyFileUtil.open_file(file)header=spreadsheet.row(1)#THISLINERAISESTHEERROR(2..spreadsheet.last_row).eachdo|i|row=Hash[[header,spreadsheet.row(i)].transpose]......endclassMyFileUtildefself.open_file(file
我正在从数据库查询中检索大量结果哈希并将它们写入csv文件。下面的代码块获取结果并创建CSV。使用quote_char:选项,它将用NULL字符替换引号,我需要这些字符才能正确创建制表符分隔的文件。但是,NULL字符在加载到目的地时会被转换为“”,因此我想删除它们。如果我省略quote_char:,每个字段都用双引号引起来,这会导致相同的结果。如何删除NULL字符?beginCSV.open("#{file_path}"'file.tab',"wb",Options={col_sep:"\t",quote_char:"\0"})do|csv|csv 最佳答案
我遇到问题,我需要下载、解压缩,然后逐行处理一个非常大的CSV文件。我认为让您了解文件有多大很有用:big_file.zip~700mbbig_file.csv~23gb这是我希望发生的一些事情:解压缩前不必下载整个文件在解析csv行之前不必解压缩整个文件在执行所有这些操作时不要占用太多内存/磁盘我不知道这是否可能。这是我的想法:require'open-uri'require'rubyzip'require'csv'open('http://foo.bar/big_file.zip')do|zipped|Zip::InputStream.open(zipped)do|unzipped
我有一个允许用户导入CSV数据的应用程序。一切正常,直到用户开始导入CSV文件中包含空白行的数据。我正在使用以下内容从CSV文件中获取行:CSV.readlines(import_file,headers:true,skip_blanks:true)我认为如果我将选项添加到skip_blanks它会这样做,但事实并非如此。关于如何忽略空白行的任何想法。谢谢! 最佳答案 这应该可行CSV.open(import_file,skip_blanks:true).reject{|row|row.all?(&:nil?)}编辑您请求了read
假设我有以下类(class):classBuyer以及CSV文件中的以下内容:FirstName,LastNameJohn,DoeJane,Doe我想将CSV的内容保存到数据库中。我在Rake文件中有以下内容:namespace:migrationdodesc"MigrateCSVdata"task:import,[:model,:file_path]=>:environmentdo|t,args|require'csv'model=args.model.constantizepath=args.file_pathCSV.foreach(path,:headers=>true,:con