arraymancer-vision

授权协议 Apache-2.0 License
开发语言 Nim
所属分类 程序开发、 图形/图像处理
软件类型 开源软件
地区 不详
投 递 者 况弘新
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

Arraymancer Vision (WIP)

Simple library for image loading, preprocessing and visualization for working with arraymancer.

Features

  • Loading image into tensors
  • Simple image transformations like flipping, rotation, scaling
  • Saving images
  • Image convolution filters like sharpen, edges
  • Visualization of images using visdom

Quick Start

Installation

Install using nimble package manager:

nimble install arraymancer_vision

For visualizing you have to install visdom and run it:

pip install visdom
python -m visdom.server

Then go to http://localhost:8097

Usage example

import arraymancer_vision

# Load image from file into a CxHxW Tensor[uint8]
var origimage = load("examples/lena.png")

# Do some preprocessing
var image = origimage.center_crop(128, 128)
image = image.hflip()
image = image.rot90(1)
image = image.filter_sharpen()
image = image.scale(512, 512, ScaleBilinear)

# Visualize it using visdom
let vis = newVisdomClient()
vis.image(origimage)
vis.image(image)

# Save it to a file
image.save("examples/preprocessed_lena.png")

This quickstart example is inside examples directory, you can run it bycloning the repo and running with nim c -r examples/quickstart.nim

You can visualize all predefined filters having visdom running and thenrunning the filters example with nim c -r examples/visualize_filters.nim

API

Documentation of the completely available API is here

Details

The library operates all images as Tensor[uint8] with dimensions CxHxW, where C is in RGBA colorspace, note that other image libraries usually operates with images in HxWxC format, so remember this when using. This design choice is to optimize and facilitate operation on images in deep learning tasks.

TODO

  • Simple drawing routines
  • Colorspace conversions
 相关资料
  • Arraymancer - A n-dimensional tensor (ndarray) library. Arraymancer is a tensor (N-dimensional array) project in Nim. The main focus is providing a fast and ergonomic CPU, Cuda and OpenCL ndarray libr

  • 我正在使用Altova StyleVision生成和XSLT-FO模板,当我生成XSLT 1.0 FO文件时,我使用下面的代码成功地将PDF与Apache FOP转换。 这段代码工作得很好。 XSLT-FO 2.0 当我从 StyleVision 生成 XSLT-FO 2.0 模板时,该问题一直在尝试使用 XSLT 2.0 的功能。 我在这里读了一篇文章,所以我下载了saxon9.jar[并添加到

  • 问题内容: 发送到Google Cloud Vision的base64编码图像出现问题。有趣的是,如果我通过URI发送图像,则可以正常工作,因此我怀疑编码方式有误。 这是交易: 我总是得到的答复是: 如果我尝试使用URI代替: 响应还可以… 我按照推荐的方式从Google进行编码 知道这里有什么问题吗? 问题答案: 我没有使用Google Cloud Vision的经验,但是在查看了他们的文档和示

  • 我们开发了一个库,其中包括使用Android移动视觉API来检测用户的脸。以下问题仅出现在联想标签E7和Billow X703上。 当它即将构建人脸检测器时,会发生异常(见下文)。接下来,代码检查检测器是否返回false。例外情况如下: 在手机上安装应用程序后,Androidanifest.xml中的一行应通知移动应用程序为特定设备下载适当的人脸检测库。然而,这似乎仅在设备重置为出厂设置和首次安装

  • 我一直在使用AutoML Vision Edge进行一些图像分类任务,在以TFLite格式导出模型时效果很好。但是,我刚刚尝试导出saved_model.pb文件并使用Tensorflow 2.0运行它,似乎遇到了一些问题。 代码段: saved_model是包含我下载的saved_model.pb文件的目录。这是我看到的: 2019-10-1823:TensorFlow binary:8.801

  • 我按照Google客户端库页面的说明开始使用Python中的Vision API(我运行的是2.7)。由于我的代码在Docker(一个Flask应用程序)中运行,我按照以下方式执行了说明: 将google-cloud-vision和google-cloud库添加到我的requirements.txt文件中。 创建了一个json帐户凭据文件,并将此文件的位置设置为名为GOOGLE_APPLICATI