我将列name
的一些数据保存如下:
`select name from temp_test`
name
1 ABCD-你好吗
2 CDEF-我很好
3 IDFASGASD-你好
4 你好
我需要的是所有的中文单词,我们不需要英文单词和'-',但不是所有的值都是带-
和英文单词的,所以我不能用SQL下面,有没有人知道怎么实现?
SELECT split_part(b.name,'-',2) from temp_project a
left join temp_test b
on a.id=b.id and a.time = b.time;
最后,我通过以下SQL解决了我的问题
SELECT CASE WHEN b.name LIKE '%-%'
THEN SPLIT_PART(b.name, '-', 2)
ELSE b.name END FROM temp_project a
left join temp_test b
on a.id=b.id and a.time = b.time;
这对你的数据有用吗?
select translate(name, 'ABCDEFGHIJKLMNOPQRSTUVWXYZ-', '') from temp_test;
在机器学习中,通常将所有的数据划分为三份:训练数据集、验证数据集和测试数据集。它们的功能分别为 训练数据集(train dataset):用来构建机器学习模型 验证数据集(validation dataset):辅助构建模型,用于在构建过程中评估模型,为模型提供无偏估计,进而调整模型超参数 测试数据集(test dataset):用来评估训练好的最终模型的性能 不断使用测试集和验证集会使其逐渐失去
一个成功的技术,现实的优先级必须高于公关,你可以糊弄别人,但糊弄不了自然规律。 ——罗杰斯委员会报告(1986) 在本书的第一部分中,我们讨论了数据系统的各个方面,但仅限于数据存储在单台机器上的情况。现在我们到了第二部分,进入更高的层次,并提出一个问题:如果多台机器参与数据的存储和检索,会发生什么? 你可能会出于各种各样的原因,希望将数据库分布到多台机器上: 可扩展性 如果你的数据量、读取负载、写
问题内容: 我已使用从IMDB收集信息并将其传输到MYSQL数据库的应用程序导入了一些数据。 似乎这些字段尚未标准化,并且在1个字段中包含许多值 例如: 有没有办法将这些值分开,然后将它们插入到另一个表中,而不重复呢? 我进行了一些谷歌搜索,发现我应该使用PHP处理此数据。但是我一点都不了解PHP。 无论如何,仅使用MYSQL即可转换此数据? 问题答案: 您可以使用存储过程,该过程使用游标来解
V9数据模型功能,允许用户把不同的数据表,分离到不同的数据库服务器上。以实现负载的分离,更加的符合大访问网站的需求。 数据分离方法 1.数据库连接配置 配置文件路径:caches\configs\database.php return array ( 'default' => array ( 'hostname' => 'localhost', 'database' => 'phpcm
我想从elasticsearch索引中删除一些数据,而不是完整的索引,我的问题是如何找到所有可用碎片的文档id。对此的查询是什么?? 我使用了以下查询来删除特定文档,但它抛出错误,所以我认为我的文档ID是错误的。请让我知道如何获取可用分片的正确文档ID。 我的数据流是postgresql到logstash到elasticsearch到kibana。但问题是索引大小正在增加很多,它进入GB的内存,而
我正在使用Flink处理来自某些数据源(如Kafka、Pravega等)的数据。 在我的例子中,数据源是Pravega,它为我提供了一个flink连接器。 我的数据源正在向我发送一些JSON数据,如下所示: 以下是我的代码: 如您所见,我使用FlinkPravegaReader和适当的反序列化程序来获取来自Pravega的JSON流。 然后我尝试将JSON数据转换为String,它们并对它们进行计